Cognition lanza Devin Fusion: modelo frontera más sidekick para abarat

Cognition (la empresa detras de Devin) lanzo el 29 de junio Devin Fusion en preview. La propuesta: en vez de mandar cada tarea a un modelo frontera caro, dos agentes corren en paralelo, uno con un modelo frontera y otro con un "sidekick" mas barato. El frontera planifica, resuelve ambiguedades y revisa al final. El sidekick ejecuta el trabajo mecanico y repetitivo.

Los numeros

En su benchmark FrontierCode Extended, Fusion combinado con Fable 5 saca un score de 57,6 a coste medio de 3 dolares por tarea. Fable 5 solo, sin Fusion, marca 57,0 a 5,12 dolares (41% mas caro para misma calidad). GPT-5.5 high se queda en 44,8 a 3,64 dolares (peor y mas caro). Comparado contra Opus 4.8 solo, Fusion da 35% de mejora de coste manteniendo calidad frontera.

Internamente, el 88% de los pull requests que Cognition mergea vienen del router automatico Fusion, no de seleccion manual de modelo. Es decir, no es un experimento: ya es el default de la propia empresa.

El truco tecnico

El reto al combinar modelos es la cache de contexto. Cambiar de modelo a mitad de sesion normalmente invalida la cache (que es lo que hace baratas las llamadas largas). Fusion programa los switches en momentos de "context compaction": puntos donde el contexto se reescribe de todos modos (porque ha crecido demasiado), asi que la penalizacion de cache miss es inevitable y el switch sale practicamente gratis.

Walden Yan, cofundador de Cognition, explico en X que la arquitectura no es "router clasico" (que rompe la cache cada vez). Es "agentes en paralelo con tools propias" donde el principal delega y revisa. La diferencia importa para cualquiera que este construyendo agentes propios.

Cognition tambien explico que es compatible con varios modelos frontera (Fable 5, Opus 4.8, GPT-5.5) y promete extender a nuevos modelos segun salgan, sin reentrenar el harness.

Por que importa

El coste de los coding agents esta siendo la conversacion incomoda en muchas empresas. Casos publicos como Uber y ServiceNow quemaron presupuesto de IA en 3-4 meses con uso descontrolado de modelos frontera. Fusion es la primera respuesta seria al problema desde un proveedor: no mas cuota rigida, no mas control burocratico, simplemente routing automatico que mantiene calidad.

Para un equipo tecnico espanol, el efecto practico es que el coste por desarrollador con agentes podria bajar entre 30 y 50% en los proximos meses sin perder calidad de output. Eso desbloquea presupuesto para casos de uso que hoy no compensan economicamente: testing exhaustivo, refactor de codigo legado, generacion automatica de documentacion, migracion entre frameworks.

Para una empresa de 10 desarrolladores que hoy paga ~500 EUR/mes por developer en agentes (5.000 EUR/mes total), una reduccion del 35% significa 1.750 EUR/mes ahorrados o 21.000 EUR/ano. Para un equipo de 50 desarrolladores con factura de 25.000 EUR/mes en coding agents, hablamos de 8.750 EUR/mes (105.000 EUR/ano). Es la diferencia entre licenciar a todo el equipo o solo a los seniors.

El segundo efecto, mas estrategico: si el coste cae 35-50%, los managers que hoy frenan adopcion por presupuesto se quedan sin argumento. La conversacion se desplaza a calidad, riesgo y formacion.

Que hacer

Si usas Devin: prueba Fusion en preview esta semana, mide coste por PR antes y despues en 5-10 tareas comparables. Documenta el delta para defenderlo internamente.
Si usas Cursor o Claude Code: pregunta a tu equipo si tienen visibilidad real del coste por tarea (no solo por mes). Si no, montar dashboards de coste por desarrollador y por tipo de tarea es mas prioritario que negociar tarifa con proveedor.
En cualquier caso, documenta esta semana que tipo de tareas pueden ir a modelo barato (lint, tests unitarios, scaffolding, cambios de copy, bumps de dependencias) y cuales requieren frontera (arquitectura, seguridad, refactor de core, integraciones criticas). Es la base para optimizar tu propio routing aunque uses otro proveedor.