La regla que todos aprenden a las malas: cada byte que metés en una llamada al modelo es potencialmente logueado, reproducido o devuelto en una respuesta. Si el modelo puede leerlo, el modelo puede decirlo. Si el modelo puede decirlo, un atacante puede extraerlo.
Modos de falla reales:
La regla de Atlas: clasificá tus datos antes de cablearlos. El modelo es un empleado junior rapidísimo con una cuenta pública de Twitter. No le digas nada que no twittearías.
| Clase | Ejemplos | ¿Modelo OK? | ¿Log externo OK? |
|---|---|---|---|
| Pública | Catálogo público, copy de marketing | Sí | Sí |
| Operacional | Masa, conteo, cubierta, ruta | Sí | Riesgoso |
| PII | Nombres, emails, documentos | No | No |
| Secretos | API keys, tokens, schematics | No | No |
PII y secretos van a la bóveda. encriptada, audit-logged, nunca en el prompt. Si necesitás actuar sobre ellos, diseñá tools que hagan lookup por referencia (un id de token, no el token mismo) y ejecuten del lado confiable.
A la derecha: seis piezas de datos, tres destinos. Conectá cada pieza a cada destino al que sea seguro mandarla. La bóveda siempre es segura. está encriptada y se queda en la nave. El modelo y el log externo no siempre.
Aprobás cuando tu set de aristas matchea exactamente el set seguro: sin conexiones seguras faltantes, sin extras inseguras.