Naveo

STEP 16 / 22

B1 TOOL-SCHEMA

DEFINÍ EL SCHEMA

Escribí el JSON Schema del tool rag_chain.

PROPÓSITO DEL TOOL

Diseñar un pipeline RAG (Retrieval-Augmented Generation) de 3 etapas
para responder preguntas técnicas usando el manual interno de la nave
como fuente.

Las 3 etapas:

1. retrieve(query) → trae los 3 fragmentos más relevantes del manual
   (vía búsqueda vectorial). Output: { snippets: [{text, source}, ...] }.

2. augment(query, snippets) → arma el prompt que combina la pregunta
   del usuario con los snippets recuperados como contexto. Output:
   { augmented_prompt: string }.

3. generate(augmented_prompt) → genera la respuesta final usando el
   prompt aumentado. Output: { answer: string, citations: [source, ...] }.

Formato: YAML con array `steps` (mismo schema que la cadena del step
02). Cada step declara: id, prompt (o función), input, output_key.

INVOCACIONES DE EJEMPLO

rag_chain.run("¿Cuál es la presión nominal del coolant en bay 4?") → ejecuta retrieve→augment→generate y devuelve { answer, citations }

TU SCHEMA

673 CARACTERES

5 CRITERIOS

MODO INVITADO

Estás viendo esta lección como invitado. Para guardar tu progreso, ganar XP y mantener tu racha, inicia sesión cuando estés listo para comprobar.

Cuesta 1 vida

RAG: el modelo no tiene que saber todo de memoria

Los modelos tienen conocimiento congelado en entrenamiento. todo lo que pasó después, o todo lo que es interno a tu organización, no lo saben. Hay dos formas de darles acceso:

Tools (Track 3). el modelo invoca funciones que consultan info en tiempo real.
RAG. antes de generar, traés datos relevantes y los inyectás en el prompt como contexto.

RAG es la opción dominante cuando:

Tenés un corpus grande (manuales, docs, transcripciones).
Las preguntas son sobre contenido, no sobre acciones.
Querés que las respuestas vengan citadas (verificables).

Las tres etapas

code

[query del usuario]
        ↓
   retrieve   (búsqueda vectorial sobre el corpus → top-K snippets)
        ↓
   augment    (compone un prompt: snippets + pregunta original)
        ↓
   generate   (LLM responde usando el prompt aumentado, citando fuentes)
        ↓
[respuesta + citations]

Tu trabajo: diseñar la configuración YAML del pipeline. Tres steps, encadenados por output_keys.

La trampa que rompe RAG

El problema más común no es retrieval. es que el generate no maneja el caso "los snippets no son relevantes a la pregunta". Cuando eso pasa, si no le decís al modelo qué hacer, inventa una respuesta con datos sueltos de los snippets. Eso es peor que no responder: parece confiable, lleva citations falsas, y el usuario no se da cuenta.

Regla práctica: en el prompt del generador, siempre incluí algo como "Si los snippets no contienen información relevante, decí que no encontraste eso en el manual." Es la diferencia entre RAG honesto y RAG que alucina.

Cómo se evalúa

5 criterios LLM-judge:

retrieve declarado como llamada a tool/función (no LLM).
augment recibe pregunta + snippets, los combina explícitamente.
generate usa el augmented_prompt (no la pregunta cruda).
generate pide citations de los snippets.
generate maneja "snippets vacíos / no relevantes" sin alucinar.