Reto 03: Grounding, Chunking, y Embedding

< Reto Anterior - Home - Siguiente reto >

Prerrequisitos

Introducción

Al trabajar con Modelos de Lenguaje Grande (LLM), es importante entender cómo fundamentarlos con los datos correctos. Además, examinarás cómo manejar los límites de tokens cuando tienes muchos datos. Finalmente, experimentarás con embeddings. Este desafío te enseñará todos los conceptos fundamentales - Fundamentación, Segmentación, Incrustación - antes de verlos en acción en el Desafío 4. A continuación, se presentan breves introducciones a los conceptos que aprenderás.

La Fundamentación (Grounding) es una técnica utilizada cuando deseas que el modelo devuelva respuestas confiables a una pregunta dada. La Segmentación (Chunking) es el proceso de desglosar un documento grande. Ayuda a limitar la cantidad de información que pasamos al modelo. Una Incrustación (Embedding) es una representación densa de información del significado semántico de un texto.

Descripción

Preguntas que deberías poder responder al final del desafío:

Tareas a realizar

Ejecutarás los siguientes tres Jupyter Notebooks para este desafío:

Estos archivos se pueden encontrar en tu Codespace bajo la carpeta /notebooks.

Criterios de Éxito

Para completar este desafío con éxito, deberías ser capaz de:

Recursos Adicionales

Siguientes pasos

Ahora puedes proseguir con el Siguiente reto »