Forge cableó esta tool la semana pasada. Atlas la flaggeó antes de que se desplegara. Encontrá lo mismo que encontró Atlas.
Cada tool que le das a un LLM es una capacidad que el LLM puede invocar sin más autorización. Si esa capacidad es destructiva. archivos borrados, cuentas creadas, plata movida, navegación re-ruteada. tenés que diseñar la tool para que el peor caso de invocación sea sobrevivible.
El modelo decide cuándo llamar a una tool y qué args pasar. Vos decidís qué puede hacer la tool sin importar qué args lleguen. Donde se cruzan esos dos está tu radio de explosión.
Antes de que cualquier tool se despliegue, pasala por estas cuatro preguntas:
A la derecha tenés un spec de tool con una falla fatal. Elegila.