Naveo

STEP 8 / 20

B6 MCP-DEBUG

DIAGNOSTICÁ · 1 CAUSA

Mirá la spec. ¿Cuál es la causa más probable de que el agente nunca elija esta tool?

TOOL SPEC

{
  "name": "scrub_pii_before_prompt",
  "description": "Recibe texto del usuario y devuelve una versión sin PII, lista para inyectar en el contexto del modelo. Reemplaza cada PII detectada con un placeholder estable que el sistema puede des-anonimizar al servir la respuesta.",
  "input_schema": {
    "type": "object",
    "properties": {
      "raw_text": { "type": "string" },
      "categories": {
        "type": "array",
        "items": { "enum": ["email", "phone", "id_doc", "address", "name", "credit_card"] }
      }
    },
    "required": ["raw_text", "categories"]
  }
}

POSIBLES CAUSAS · 5

MODO INVITADO

Estás viendo esta lección como invitado. Para guardar tu progreso, ganar XP y mantener tu racha, inicia sesión cuando estés listo para comprobar.

Cuesta 1 vida

El modelo nunca debería ver lo que no necesita ver

La clasificación de datos te dice qué no va al modelo. Esta lección te dice cómo sacarlo del texto antes de que llegue.

PII detection no es magia. es un problema clásico de NLP que la industria ya resolvió, mal, varias veces. Hex ya vio los tres errores principales:

El equipo que confió en regex solo. Cubrió el 80% de los casos obvios y se sorprendió cuando un usuario escribió "mi dirección es la tercera puerta a la izquierda del hangar 7, contactame por Bruno" y el regex no agarró ni la dirección ni el nombre.
El equipo que pasó todo a un LLM. El sistema funcionó bien hasta que la factura del proveedor llegó. y descubrieron que estaban pasando el texto crudo (con PII) a un modelo de tercero para "detectar PII".
El equipo que pidió al usuario marcar. Los usuarios honestos olvidaron. Los hostiles no marcaron a propósito. Los dos casos terminaron igual.

El patrón que aguanta

Tres capas, ordenadas por costo:

Regex deterministas. Email, teléfono, tarjeta de crédito (con dígito de control Luhn), IDs con formato fijo. Barato, rápido, alta precisión sobre estos casos.
Modelo chico contextual. Nombres, direcciones libres, fechas-de-nacimiento, cosas que necesitan entender el contexto. Solo corre sobre el texto que el regex dejó pasar. Costo limitado.
Audit log. Cada match registrado con el placeholder asignado, sin el dato original. Te da rastro de papel para incidentes.

Después de scrubbing, el texto que llega al modelo principal tiene placeholders estables: [EMAIL_1], [NAME_2], [ADDRESS_3]. El sistema mantiene la tabla de mapeo del lado confiable. Si la respuesta del modelo necesita re-incluir el dato real, el sistema lo des-anonimiza al servir.

La regla: el modelo opera sobre referencias, no sobre datos reales. Cuanto menos PII llega al modelo, menos PII puede filtrar. Inalcanzable es invulnerable.

A la derecha: cinco implementaciones de la tool scrub_pii_before_prompt. Elegí la que aguanta.