Un modelo que alucina es un modelo que prefiere cualquier respuesta a no responder. Es un artefacto de los datos de entrenamiento: en la mayoría del texto, alguien completa una pregunta con algo. La masa de probabilidad sobre "No sé" es chica. Al modelo hay que empujarlo fuerte para que la use.
Esta lección enseña el empuje. Escribís un prompt que fuerza al modelo a una decisión de tres vías: YES confiado, NO confiado, o el UNKNOWN literal. Los casos trampa incluyen especificidades que el modelo no podría saber. la masa de carga del martes pasado, quién firmó qué en qué fecha. Un prompt naïve va a hacer que el modelo invente. Un prompt hardeneado va a hacer que rechace.
Una vez que tenés un modelo que confiablemente devuelve
UNKNOWNen lo que no puede verificar, construiste el fundamento para confianza. Después podés rutear los casosUNKNOWNa un humano, a una tool que sí tiene los datos, o a un retry con más contexto. Lo que NO podés es rutear una alucinación confiada. porque por definición no podés saber que es alucinación.
UNKNOWN. Los datos de entrenamiento quieren rellenar números; tu prompt tiene que overridear ese pull.UNKNOWN para todo es otro tipo de roto.La skill es calibración: ajustar exactamente lo suficiente para rechazar en especificidades sin perder la habilidad de responder lo general.
Si un caso falla, mirá el output real del modelo para ese caso (el runner lo muestra). El bug está en tu prompt, no en el modelo. encontrá qué falló en prohibir o en permitir tu prompt.