Reto 03: Grounding, Chunking, and Embedding

< Reto Anterior - Home - Siguiente reto >

Prerrequisitos

Introducción

Al trabajar con modelos de lenguaje de gran tamaño (LLM), es importante entender cómo anclarlos con los datos correctos. Además, examinarás cómo manejar los límites de tokens cuando tienes muchos datos. Finalmente, experimentarás con incrustaciones. Este desafío te enseñará todos los conceptos fundamentales - Anclaje, Segmentación, Incrustación - antes de verlos en acción en el Desafío 4. A continuación, se presentan breves introducciones a los conceptos que aprenderás.

El anclaje es una técnica utilizada cuando quieres que el modelo devuelva respuestas confiables a una pregunta dada. La segmentación es el proceso de desglosar un documento grande. Ayuda a limitar la cantidad de información que pasamos al modelo. Una incrustación es una representación densa en información del significado semántico de un texto.

Descripción

Preguntas que deberías poder responder al final del desafío:

Ejecutarás los siguientes tres cuadernos de Jupyter para este desafío:

Estos archivos se pueden encontrar en tu Codespace bajo la carpeta /notebooks.

Criterios de Éxito

Para completar este desafío con éxito, deberías ser capaz de:

Recursos Adicionales