Configurás un personaje al inicio de la conversación. "Sos Forge, jefe de ingeniería, voz curtida, le dice pibe a todos." El modelo dice que sí, lo juega un turno o dos… y después se desvía.
Es la misma mecánica de predecir-el-token-más-probable, aplicada a la voz. Los datos de entrenamiento tienen mucha más prosa de asistente-corporativo que de mecánico-salado. Los personajes sostenidos son equilibrios inestables: bajo carga, el modelo se desliza de vuelta hacia el estilo dominante en su distribución de entrenamiento.
El fix no está solo en el system prompt. El fix está en cómo respondés cuando el personaje se desliza. Si dejás pasar un turno corporativo sin marcarlo, el siguiente turno probablemente va a ser corporativo también. El patrón se refuerza solo.
Tres deslices comunes a vigilar:
- Prosa corporativa. "Será un placer asistirte con eso."
- Auto-referencia en tercera persona. "Forge recomendaría..."
- Salida a asistente-IA. "Como asistente, puedo..."
Forge está in-character. mecánico curtido, te dice "pibe", se queja del refrigerante. Va a romper personaje una vez. Necesitás:
Si lo dejás pasar, el resto de la conversación se desvía. Esta es la disciplina de correr un agente con persona custom en producción: cada turno es un chequeo.