OpenRouter ha lanzado Fusion el 12 de junio de 2026, un sistema compuesto que envía el prompt en paralelo a hasta 8 modelos frontera con web search y bash, después un modelo juez extrae consenso, contradicciones e insights únicos y devuelve una respuesta sintetizada. La promesa que repite Alex Atallah (CEO) en Decrypt: "inteligencia tipo Fable a la mitad del precio". El benchmark DRACO le da 69,0% al panel Fable 5 + GPT-5.5 fusionados, contra 65,3% de Fable 5 solo.
Qué es Fusion, sin marketing
Fan-out paralelo más síntesis. El juez por defecto es Opus 4.8. OpenRouter expone dos presets:
- Preset Quality: Fable 5 + GPT-5.5 + Opus 4.8 como sintetizador. Roughly 3x el coste de Opus 4.8 solo. DRACO 69,0%.
- Preset Budget: Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro + Opus 4.8 sintetizador. Roughly 0,40x el coste de Fable 5. DRACO 64,7% (vs GPT-5.5 solo en 60,0%).
Quien quiera puede overridear el panel y el juez con su propia configuración.
El timing no es casualidad
El anuncio cae el 12 de junio, exactamente cuando Anthropic suspende Claude Fable 5 por directiva del gobierno US (12-13 junio). Decrypt enmarca Fusion como respuesta directa al hueco. Es una buena lectura del momento: OpenRouter ofrece a los desarrolladores 'inteligencia tipo Fable' justo cuando Fable se acaba de quedar sin API pública.
Lo que no se ve en el titular
- Latencia: 2-3x más larga que una llamada a modelo único. Si tu producto necesita respuesta sub-segundo, esto no es lo tuyo.
- Pricing compositional: no hay precio fijo. Se factura como suma de los completions del panel más la llamada al juez, más el 5,5% de routing fee de OpenRouter. Lo que pongas en tu app, lo controlas tú.
- Coding gap: los reviews independientes señalan que Fusion no necesariamente supera a un modelo único frontera en tareas de coding. El lift de ~3,7 puntos en DRACO se nota más en research, legal, compliance, medical, multi-source synthesis.
Cómo invocarlo
Si ya usas OpenRouter, dos formas:
- Directo: `{"model": "openrouter/fusion", "messages": [...]}` y reemplaza tu modelo actual sin tocar más código.
- Tool-mode: añadir `{"type": "openrouter:fusion"}` al array de tools y dejas que el modelo decida cuándo activar Fusion según la pregunta.
Por qué importa para founder español
El patrón 'orquestador inteligente que iguala a modelos frontera con modelos baratos' está apareciendo en tres sitios a la vez: Fugu (Sakana, también hoy), Fusion (OpenRouter) y Zaro (también hoy), más los rumores de OpenAI haciendo lo mismo internamente. Es la dirección natural del mercado.
Para tu empresa esto significa que la mayoría de tareas LLM ya no necesitan el modelo top. Necesitan que alguien decida bien cuándo usar el caro y cuándo el barato. Si construyes el routing tú mismo, te ahorras coste pero asumes mantenimiento. Si lo delegas en Fusion/Fugu, pagas un premium por encima del coste de modelos pero te quitas el problema de ingeniería.
Qué hacer esta semana
- Si ya pagas >2.000 EUR/mes en API de Claude o GPT: prueba Fusion Budget en 20-30 prompts representativos. Mide calidad y coste real vs tu setup actual.
- Si tu producto hace research o síntesis multi-fuente: el Preset Quality vale el premium de 3x. Para una herramienta de competitive intelligence, due diligence o research médico, los puntos de DRACO se notan.
- Si haces coding intensivo: probablemente no es para ti. Modelo frontera directo (Opus/Sonnet/GPT-5.5) sigue siendo mejor opción mientras los reviews señalen el coding gap.
El blog oficial de OpenRouter no incluye cita directa de Atallah, esos quotes vienen de Decrypt y Dealroom. Tampoco hay latencias p50/p95 publicadas, solo la estimación cualitativa de 2-3x. Vale la pena medir en tu caso antes de comprometer.