Naveo

STEP 21 / 27

B3 TOOL-HANDLER

IMPLEMENTÁ EL HANDLER

Implementá el handler del tool get_weather.

SCHEMA DEL TOOL (READ-ONLY)

{
  "name": "get_weather",
  "description": "Devuelve las condiciones atmosféricas actuales de un deck de la nave. Los datos cambian lento (cada ~60 segundos). Read-only.",
  "parameters": {
    "type": "object",
    "properties": {
      "deck": { "type": "string", "enum": ["A", "B", "C", "engineering", "medical"] }
    },
    "required": ["deck"]
  }
}

ESCENARIOS · 4

Primera call para deck='A'. Cache vacío.

EXPECTED: ok: true, data: {...}, cached: false. Llama a la API.

Segunda call para deck='A' a los 10 segundos. Cache hit.

EXPECTED: ok: true, data: {mismo que el anterior}, cached: true. NO llama a la API.

Call para deck='B' a los 10 segundos. Otro deck, no debe haber colisión.

EXPECTED: ok: true, data: {nuevo}, cached: false. Llama a la API. (deck B tiene su propio espacio de cache).

Call para deck='A' a los 75 segundos. Cache expiró (TTL 60s).

EXPECTED: ok: true, data: {nuevo}, cached: false. Re-llama a la API.

TU CÓDIGO

743 CARACTERES

EVALUADO POR LLM-JUDGE · SIN EJECUCIÓN

MODO INVITADO

Estás viendo esta lección como invitado. Para guardar tu progreso, ganar XP y mantener tu racha, inicia sesión cuando estés listo para comprobar.

Cuesta 1 vida

El agente pregunta lo mismo todo el tiempo

En un turno de agente típico, el modelo puede invocar la misma tool varias veces seguidas para construir un resumen, comparar, o verificar antes de actuar:

"Voy a chequear el stock antes de modificarlo." → list_inventory_items()
"Bien, ahora agrego 5 unidades." → add_inventory()
"Confirmemos el resultado." → list_inventory_items() (otra vez)

Si tu tool toca una API externa, una DB lenta, o un servicio con rate limit, esa triple call te cuesta plata, latencia y a veces te tira el rate limiter encima.

La solución es un patrón viejo y conocido: cache con TTL. La novedad cuando lo aplicás a tools de un agente:

El agente no sabe que existe el cache, ni le importa. Para él, la tool simplemente responde rápido.
El cache es transparente. Mismo input, mismo output. Lo único que cambia es la latencia y un flag cached: true para diagnóstico.
El TTL depende del dominio. Datos del clima cambian lento (60s OK). Precios financieros cambian rápido (5s o nada). Stock de inventario: depende.

Qué cachear

✓ Tools de lectura (idempotentes naturales). get_X, list_X, lookup_X.

✓ Tools cuyos datos cambian lento. Configuración, catálogos, datos de referencia.

✓ Tools caras (latencia alta o costo por call).

Qué NO cachear

✗ Tools de escritura. Cada call hace algo distinto. No tiene sentido.

✗ Tools cuyos datos cambian rápido. Si tu TTL es más largo que la frecuencia de cambio real, devolvés datos viejos como si fueran nuevos.

✗ Tools con resultados dependientes del usuario sin separar la key. Si cacheás get_my_bookings() con key "default", todos los usuarios ven los bookings del primero. La key del cache tiene que incluir el contexto que distingue.

Estructura típica

const cache = new Map(); // key → { data, fetchedAt }
const TTL_MS = 60_000;

async function handle({ deck }) {
  const key = deck;
  const cached = cache.get(key);
  if (cached && Date.now() - cached.fetchedAt < TTL_MS) {
    return { ok: true, data: cached.data, cached: true };
  }
  const data = await atmosphericApi.read(deck);
  cache.set(key, { data, fetchedAt: Date.now() });
  return { ok: true, data, cached: false };
}

El `cached: true` también es información

Devolver el flag cached: true cuando hay hit le permite al agente decisiones interesantes:

"Datos del clima del deck A (capturados hace 25 segundos)" en vez de afirmar como si fueran live.
En debugging, distinguir un comportamiento viejo (cached) de uno actual.
Si el agente necesita datos frescos (decisión crítica), puede ignorar el cache. ojo: eso es otro patrón (force-refresh), opcional pero útil.

Tu tarea

A la derecha tenés get_weather sin cache. Agregalo: cache in-memory con TTL de 60s, key por deck, flag cached.

Cachear bien es de las optimizaciones más baratas y de mayor impacto en MCPs reales. Una hora de trabajo, una orden de magnitud menos en costo de API.