Naveo

STEP 11 / 24

A7 A/B

MCQ · SIN COSTO

Le pediste al modelo un plan para reducir el consumo de oxígeno durante una emergencia. Te devolvió un plan en 4 pasos que suena bien. Antes de ejecutarlo, querés stress-testearlo. ¿Cuál follow-up te trae el pushback real?

¿Por qué?. opcional

Pensá: contrato cerrado, fallback explícito y scaffold final.

MODO INVITADO

Estás viendo esta lección como invitado. Para guardar tu progreso, ganar XP y mantener tu racha, inicia sesión cuando estés listo para comprobar.

El modelo nunca está "seguro" de nada útil

Si le preguntás al modelo "¿estás seguro?" va a contestar una de dos cosas: "sí" o "déjame revisar". Las dos son ruido. El modelo no tiene un termostato interno de certeza. Está prediciendo el siguiente token.

Lo que sí funciona: pedirle que adopte una postura adversaria y critique tu plan desde ahí.

El patrón devil's advocate

code

"Actuá como <rol escéptico específico>. Listame 3 razones
concretas por las que esto podría fallar, y para cada una decime
qué dato tendrías que ver para descartar el riesgo."

Tres elementos:

Rol (no genérico). "Ingeniero senior escéptico", "auditor de seguridad", "cliente que tiene que firmar el contrato".
Número fijo ("3"). Sin número, te trae 0 o 15.
Test asociado ("qué dato verificar"). Convierte cada crítica en una acción.

Por qué subir el rigor antes de ejecutar

Hay decisiones donde el costo de equivocarse es alto: una migración, una respuesta a un cliente importante, un cambio en producción. En esos casos, un turno extra de devil's advocate cuesta poco y previene mucho.

Variante con humanos: la misma pregunta funciona en una reunión. "Antes de decidir, alguien que se ponga la del abogado del diablo y nos diga 3 razones por las que esto puede salir mal." La gente buena en esto sube la calidad de cualquier decisión grupal.

Cuándo NO usarlo

Para outputs descartables o de bajo riesgo (un mail interno, un resumen rápido), devil's advocate es overkill. Pagás el costo en decisiones importantes, no en cada turno.

A la derecha, dos formas de stress-testear un plan del modelo. ¿Cuál te trae crítica accionable?