Sakana lanza Fugu, un modelo que orquesta otros modelos detrás de una sola API

Sakana AI, el laboratorio japonés liderado por Llion Jones (coautor del paper original de Transformers, ex-Google Brain), ha lanzado Fugu. No es un modelo que responde directamente. Es un modelo que orquesta un pool de otros modelos detrás de una sola API. La pitch es directa: si el gobierno americano puede bloquear a Anthropic de un día para otro como ha pasado con Mythos y Fable, depender de un único proveedor es un riesgo operativo serio. Fugu vende cobertura.

Cómo funciona la orquestación

Fugu es un LLM entrenado específicamente para orquestar otros LLMs. Recibe una query, decide qué parte puede resolver él mismo, qué subtareas delegar, a qué helper enviarlas, valida los resultados parciales y compone la respuesta final. Todo detrás de una API compatible con OpenAI, lo que significa que cambiar tu base_url y tu API key es suficiente para migrar.

Dos versiones:

  • Fugu: balance latencia/precisión. Para code review en CI, chatbots de producto, servicios interactivos donde el usuario espera respuesta en 2-3 segundos.
  • Fugu Ultra: máxima precisión, coordina un pool más profundo de expertos. Para research, ciberseguridad, búsqueda de patentes, análisis científico. Latencia más alta a cambio de calidad.

Una pieza importante para empresa regulada: ambas versiones permiten excluir helpers concretos por compliance. Si tu sector no puede mandar datos a un modelo chino o europeo concreto, configuras la lista de exclusión y la orquestación lo evita.

Los números, con asterisco

Sakana afirma que Fugu Ultra rinde 'codo con codo' con Fable 5 y Mythos Preview en benchmarks de coding, reasoning y ciencia. El asterisco importa: las comparaciones vienen de los reportes públicos de cada provider, no de auditorías independientes. Cuando un modelo A se publica con benchmark X y un modelo B con benchmark X' (versión ligeramente distinta), comparar A vs B directamente es engañoso. Esto pasa con todos los launches, no solo con Sakana, pero pesa más cuando el producto entero es 'somos tan buenos como los frontier'.

La reacción del mercado

Mixta. Ethan Mollick y otros power users han publicado en X que la experiencia real no acompaña los números. Las críticas se concentran en dos puntos. Primero, qué modelos hay realmente debajo. Sakana no ha publicado la composición exacta del pool, lo cual es entendible (ventaja competitiva) pero impide reproducir resultados. Segundo, el coste por query cuando el orquestador invoca a 3-4 helpers para una sola respuesta. La factura puede multiplicarse rápido si el routing no está bien calibrado.

Por qué Japón, por qué ahora

Sakana viene de una línea de investigación clara desde su fundación: en lugar de hacer un modelo gigante, combinar modelos especializados más pequeños. Es la apuesta opuesta a OpenAI y Anthropic, y hasta ahora se había quedado en el terreno académico. El bloqueo a Anthropic les ha dado el ángulo comercial que les faltaba: orquestación como cobertura geopolítica.

Hay una segunda lectura: Japón quiere posicionarse como tercera vía entre el bloque americano y el chino para la infraestructura de IA. Fugu es coherente con esa posición. Una empresa europea que quiere reducir dependencia americana sin saltar al ecosistema chino tiene en Sakana un proveedor plausible.

Por qué importa más allá de Sakana

El patrón de orquestación va a ser estándar en 18 meses. OpenRouter lleva meses con Fusion, Together AI tiene rutas similares, y los grandes labs van a tener su propia versión. La razón es económica: no tiene sentido pagar el coste de Mythos Preview para resolver una pregunta de 'cuál es la capital de Francia'. Un router que mande las queries simples a un modelo de 8B y las complejas a un frontier puede bajar tu factura un 60-70% sin que el usuario lo note.

Qué hacer

  • Si estás en producción con un proveedor único (solo OpenAI o solo Anthropic): no migres a Fugu mañana, pero monta un piloto la semana que viene en un caso real y compáralo con tu setup actual sobre las mismas 100 queries. Te da el dato propio para decidir, sin depender de benchmarks de provider.
  • Si tienes compliance estricto (banca, salud, defensa): la lista de exclusión de helpers de Fugu es una pieza que ni OpenAI ni Anthropic ofrecen hoy. Vale la pena pedirle a tu DPO que la evalúe.
  • Si estás diseñando un agente desde cero en 2026: el patrón de orquestación es el default. Aunque uses solo modelos de un proveedor, separa el router del executor en tu arquitectura. Cuando llegue el momento de meter un segundo modelo o de cambiar de proveedor, el coste de migración será de horas, no de semanas.