Lo más anti-intuitivo de tool use es esto: el modelo no entiende tu tool por su nombre o su código. Lo entiende por la descripción que vos escribiste. Y solo por eso.
Si la descripción dice "Busca un crewmate", el modelo tiene que adivinar:
El modelo se equivoca en una de estas adivinanzas y el tool queda mal usado o ignorado. La métrica que importa es precision + recall:
Las dos suben cuando la descripción es específica y delimitada: dice cuándo SÍ, cuándo NO, y qué garantiza.
Cuando una description dice algo que el modelo no podría inferir solo del nombre, está agregando valor. Cuando dice lo mismo que ya dice el nombre, está ocupando espacio.
Elegí la opción correcta a la derecha.