OpenRouter Fusion API: una llamada lanza el prompt a varios modelos y un juez sintetiza la respuesta

OpenRouter, el router que muchas empresas usan para acceder a múltiples modelos con una sola API key, integró el 12 de junio Fusion en su API después de tres meses de experimento público desde marzo. Mandas un prompt y la plataforma lo ejecuta en paralelo en varios modelos frontera (Claude, GPT, Gemini, Kimi, DeepSeek) y un "judge model" sintetiza las respuestas en una sola.

Los números que publica OpenRouter

En el benchmark interno la empresa muestra dos resultados llamativos. Primero, Fable 5 + GPT-5.5 combinados alcanzan 69.0% frente al 65.3% de Fable 5 solo. Segundo, un panel "budget" formado por Gemini 3 Flash, Kimi K2.6 y DeepSeek V4 Pro supera a GPT-5.5 y Opus 4.8 individuales. Es decir, varias opiniones baratas bien sintetizadas baten a una opinión cara individual. La validación independiente todavía es limitada, hay que tomar el dato como punto de partida, no como ley.

Cómo se usa

Dos caminos. Sin código: abres openrouter.ai/fusion y eliges un preset o construyes un panel custom con los modelos que quieras y el judge. Por API: mandas `model="openrouter/fusion"` a cualquier endpoint de inferencia y el plugin se auto-inyecta con un panel default de frontera. La fontanería ya está montada porque miles de empresas usan OpenRouter como router de modelos.

El coste es el dato clave: multiplica el de un modelo individual por el número de participantes del panel, más el judge. Un panel de 4 modelos cuesta aproximadamente 5 veces más que llamar a uno solo. Por eso Fusion está pensado para deep research, tareas críticas o exploración, no para pipelines de alto volumen.

Por qué importa para founders españoles

El año pasado el debate era "qué modelo es mejor". Este año el debate empieza a ser "qué combinación de modelos es mejor", y la respuesta sigue siendo: depende del trabajo. Lo interesante para una empresa española de 10-200 personas no es el benchmark, es la economía. Tres modelos baratos en panel pueden batir a Opus 4.8 a menos coste total que llamar al frontera caro. Para deep research y análisis críticos, el cálculo cambia.

Qué hacer

  • Si haces deep research o resúmenes legales: prueba Fusion en 20-30 consultas esta semana contra tu modelo actual. Compara calidad subjetiva. El coste por consulta es 3-5x el de un solo modelo, pero el output puede compensar.
  • Si tu pipeline es alto volumen y bajo coste por petición: Fusion no es para ti. Multiplicar por 4 el coste de tokens en una pipeline de millones de llamadas mata el margen.
  • Si ya pagas Opus 4.8 caro por defecto: prueba el panel budget (Gemini Flash + Kimi + DeepSeek). Si funciona, ahorras coste total con calidad equivalente o mejor.