Naveo

STEP 18 / 24

A7 A/B

MCQ · SIN COSTO

Estás iterando un agente que conversa con usuarios. A veces el output del turno 6 está mal y no sabés por qué. ¿Qué información necesitás capturar de cada conversación para poder diagnosticar el problema después?

¿Por qué?. opcional

Pensá: contrato cerrado, fallback explícito y scaffold final.

MODO INVITADO

Estás viendo esta lección como invitado. Para guardar tu progreso, ganar XP y mantener tu racha, inicia sesión cuando estés listo para comprobar.

El bug del turno 6 nació en el turno 2

Cuando una conversación con LLM falla, casi nunca falla en el turno donde lo notás. El output malo del turno 6 suele venir arrastrado de algo que pasó turnos antes: una asunción mal hecha, una pregunta vaga, una respuesta floja que nadie cuestionó.

Para poder diagnosticar, necesitás ver la conversación entera. Y para ver la conversación entera, tenés que haberla loggeado bien desde el principio.

Los 4 elementos mínimos del log

code

{
  "conversation_id": "...",
  "system_prompt": "<full text>",
  "model": "claude-opus-4-7",
  "params": { "temperature": 0.7, "max_tokens": 2048 },
  "turns": [
    { "role": "user", "ts": "...", "content": "..." },
    { "role": "assistant", "ts": "...", "content": "..." }
  ]
}

Por qué cada elemento importa

conversation_id: sin ID compartido, no podés filtrar los turnos de UNA conversación específica entre millones.
system_prompt: si cambiás el system prompt en un deploy y un usuario reporta un bug, necesitás saber qué system estaba activo cuando pasó.
model + params: la misma conversación con temperature 0.3 vs 0.9 puede dar outputs muy distintos. El modelo cambia entre versiones; el log tiene que saber cuál se usó.
turns con timestamps: orden de ejecución + latencia entre turnos (útil para detectar slowdowns o timeouts).

Lo que NO sirve

Anti-patrón	Por qué falla
Solo loggear el último turno	No reproducís el bug.
Loggear sin conversation_id	Imposible reconstruir la sesión.
Loggear sin system_prompt	Cuando cambia, perdés la historia.
Loggear con prints en consola	Se pierden, no se buscan, no se filtran.

Tip avanzado: si tu app deja al usuario corregir/editar mensajes anteriores (como ChatGPT), tu log tiene que capturar cada versión del mensaje, no solo la última. Si no, vas a tener conversaciones donde "el usuario dijo X" y el modelo respondió a "Y" sin que entiendas por qué.

Cuándo importa

Si solo estás explorando un chat, no necesitás esto. screenshots alcanzan.
Si vas a poner un agente en producción, este logger es infra obligatoria.
Si estás iterando un system prompt y comparando versiones, vas a agradecer haberlo armado desde el día 1.

A la derecha, dos formas de loggear conversaciones. ¿Cuál te permite debuggear el bug del turno 6?