Sakana lanza Fugu: sistema multiagente que iguala a Fable 5 con una sola API

Sakana lanza Fugu: sistema multiagente que iguala a Fable 5 con una sola API

Sakana AI lanza Fugu, un sistema que funciona como un solo modelo pero por dentro es un orquestador multiagente. Una llamada API a un endpoint y Fugu decide qué modelos usar, cómo deben comunicarse entre ellos y qué pasos seguir. El claim: la variante Fugu Ultra iguala a Fable 5 y Mythos Preview en benchmarks de ingeniería, ciencia y razonamiento, sin acceso directo a esos modelos, solo orquestando los públicos.

Qué es Fugu, en dos variantes

  • Fugu: balance entre latencia y calidad. Pensado para uso interactivo, revisión de código, tareas del día a día donde la espera importa.
  • Fugu Ultra: máxima calidad. Coordina un pool más profundo de agentes expertos, pensado para problemas complejos de varios pasos donde puedes esperar más a cambio de mejor resultado.

Los benchmarks que publica Sakana

Fugu Ultra encabeza 10 de los 11 benchmarks publicados, según la propia comparativa de Sakana. Los datos más relevantes:

  • SWE-Bench Pro: Fugu Ultra 73,7% vs Claude Opus 4.8 69,2% vs GPT-5.5 58,6%
  • LiveCodeBench: Fugu Ultra 93,2 vs Claude Fable 5 89,8
  • GPQA-D: Fugu Ultra 95,5 vs Mythos Preview 94,6
  • El único benchmark que GPT-5.5 gana es MRCRv2

La tesis técnica que importa

Fugu Ultra iguala a modelos frontera cerrados solo orquestando los modelos públicos disponibles. No incluye Fable ni Mythos en el pool porque están restringidos por el gobierno americano (ver noticia de hoy sobre GPT-5.6 staggered release). La idea de fondo: un router inteligente con buenos modelos genéricos puede competir con un modelo frontera cerrado. Si se valida, la economía de la IA cambia.

Detrás del trabajo hay nombres con peso. Sakana AI lo fundaron David Ha (ex-Google Brain) y Llion Jones (coautor del paper original del Transformer). El trabajo se apoya en dos papers de ICLR 2026 (TRINITY y Conductor) más un technical report (arXiv:2606.21228). Eso es señal académica que diferencia este lanzamiento del 'subimos modelo a Hugging Face cada semana' que se ve en X.

Acceso técnico y precio

API compatible con OpenAI vía console.sakana.ai. Cualquier librería que hable hoy con la API de OpenAI puede apuntar a Fugu cambiando la URL base, sin cambiar el código. El modelo Fugu Ultra (id `fugu-ultra-20260615`) tiene pricing pay-as-you-go: ~5 USD por 1M tokens de input y ~30 USD por 1M tokens de output. Las suscripciones empiezan en 20 USD/mes (entry), 100 USD/mes (pro) y 200 USD/mes (max).

Por qué importa: la dirección del mercado

Tres lanzamientos independientes en la misma semana apuntando a la misma idea: Fugu (Sakana), Fusion (OpenRouter) y Zaro, cubiertos hoy. Todos con router inteligente sobre modelos públicos. Cuando aparecen tres apuestas independientes a la misma tesis en una semana, suele indicar dirección de mercado, no coincidencia.

Para una empresa europea con presupuesto medio, esto es noticia buena. Si el patrón se confirma en 6-12 meses, el coste de acceder a capacidad tipo frontera cae sin depender de que Mythos o GPT-5.6 estén disponibles. Y el hedge de stack (Claude + GPT + Gemini + open-source detrás de un router) deja de ser proyecto de ingeniería interna y pasa a ser producto comprable.

Cautela razonable: los benchmarks son del propio lab. Hay que esperar validación independiente antes de mover producción crítica. La industria está llena de modelos que en benchmarks demo eran 'el siguiente Claude' y en casos reales no aguantaban.

Qué hacer esta semana

  • Si ya usas la API de OpenAI: probar Fugu apuntando a console.sakana.ai en un entorno de staging con 10-20 prompts representativos. Compara coste y latencia.
  • Si tu equipo evalúa stack para 2027: añadir orquestadores (Fugu, Fusion, Zaro, OpenRouter) a la lista de opciones junto a 'API directa de Claude/GPT'.
  • Si haces gasto >5.000 EUR/mes en API: el ahorro potencial al enrutar tareas simples a modelos baratos justifica una prueba estructurada de 2-4 semanas.