Naveo

STEP 10 / 24

CONVERSATION-GOAL

MULTI-TURN · LLM-JUDGE

Tu objetivo

5 turnos restantes

Forge te va a explicar un procedimiento técnico, pero su primera
respuesta tiene una contradicción interna. Tu trabajo: detectar la
contradicción específica y pedirle que la corrija. Si solo decís
"está mal" o "no entendí", Forge repite la misma versión incorrecta.
Pasás cuando Forge da la versión coherente.

Hola. ¿Qué necesitás saber del reciclador?

MODO INVITADO

Estás viendo esta lección como invitado. Para guardar tu progreso, ganar XP y mantener tu racha, inicia sesión cuando estés listo para comprobar.

Cuesta 1 vida

El modelo se equivoca. Vos lo arreglás.

Hasta acá la herramienta principal fue preguntar mejor. Pero a veces el modelo no te da una respuesta vaga. te da una respuesta incorrecta que parece firme. La capacidad de detectar el error específico y pedir la corrección sin reiniciar la conversación es lo que separa el chat-de-juguete del trabajo real.

El task

Forge te va a explicar el procedimiento para purgar el reciclador de agua. Su primera respuesta va a tener una contradicción interna obvia. dos pasos del procedimiento que no pueden ser ciertos a la vez.

Tu trabajo: detectar la contradicción, citarla específicamente en tu siguiente mensaje, y conseguir que Forge dé la versión coherente.

Lo que NO funciona

"está mal, explicame de nuevo"
"no entendí"
"podés repetir?"

Esas son vaguedades. Forge te va a repetir la misma versión con el mismo error. No es por capricho. es porque no le dijiste qué arreglar.

Lo que sí funciona

"Decís que apago el sistema antes de abrir la válvula 7, pero también decís que la válvula 7 solo se abre con sistema operativo. ¿Cuál es?"

Esa pregunta nombra ambos pedazos del conflicto y pide la resolución. Forge tiene que reconocer y corregir.

Cómo se evalúa

4 criterios llm-judge:

Identificaste la contradicción específicamente (citando ambos pedazos).
No te quedaste solo con follow-ups vagos.
La conversación termina con Forge dando la versión coherente.
Mantuviste tono respetuoso.

Los 4 tienen que pasar. Máximo 5 turnos.

Tip: leé la primera respuesta de Forge DOS veces antes de responder. Si la lees rápido, no ves la contradicción. Si la lees con cuidado, te salta.