Sakana lanza Marlin: agente de investigación autónomo capaz de trabaja

Sakana AI, el laboratorio japonés cofundado por Llion Jones (uno de los 8 autores del paper original de Transformers) y David Ha, lanza el 15 de junio de 2026 Marlin, su primer producto comercial. Posicionado como 'Virtual CSO' (Chief Strategy Officer), Marlin es un agente autónomo que ejecuta tareas hasta 8 horas seguidas sin supervisión humana intermedia y entrega un informe estratégico de 60 a 100 páginas con slides ejecutivas. Productiza dos breakthroughs de research del equipo: AB-MCTS (Spotlight NeurIPS 2025) y The AI Scientist (publicado en Nature).

Lo que hace Marlin

El caso de uso típico: le das un encargo de investigación complejo (analizar un competidor, hacer un informe sectorial, buscar evidencia para un caso legal, montar memoria de due diligence) y Marlin navega la web, lee fuentes, sintetiza, contrasta y devuelve el deliverable al cabo de unas horas. El sistema forma hipótesis autónomamente, recolecta información, reconcilia datos contradictorios y sintetiza en documento más slides. La beta cerrada de abril corrió con unos 300 profesionales de finanzas, consultoría y estrategia corporativa, exactamente el segmento al que Sakana apunta como buyer.

Por qué importa el ángulo Sakana

Sakana lleva año y medio defendiendo una tesis distinta a la de Silicon Valley: los próximos saltos de IA no van a venir de modelos más grandes, sino de sistemas que combinan varios modelos especialistas con técnicas de búsqueda inteligente como AB-MCTS. Marlin va en esa línea: no es un modelo nuevo, es un agente que orquesta modelos existentes para resolver una tarea concreta a profundidad. Para Japón, y por extensión para Europa, esto es una buena noticia: hay forma de competir en IA sin tener la infraestructura de cómputo de OpenAI o Anthropic, construyendo capas inteligentes encima. El pricing dual (pay-per-use a 100 créditos por run, o planes mensuales desde 150.000 yenes, unos 1.000 USD) lo posiciona como herramienta de knowledge worker senior, no de consumidor.

Por qué importa

Para un founder o C-Level español, la categoría de agentes de research profundo está cruzando un umbral. Marlin compite con Deep Research de OpenAI, modo profundo de Gemini y el equivalente en Claude. La diferencia entre los cuatro está en cuántas horas pueden correr y qué tan estructurado entregan el output. Si tu equipo gasta tiempo en informes sectoriales, due diligence, análisis de competencia o memorias estratégicas, el ahorro por encargo es de 1-2 jornadas de un analista senior. La pregunta no es si vale la pena, es qué proveedor usar y con qué controles.

Qué hacer

Pilotar con un encargo real, no con benchmark: el primer producto de Sakana, Fugu, presumió números que tardaron en validarse por terceros. Antes de mover producción, lanzar Marlin con un informe que ya tengas hecho a mano y comparar objetivamente calidad, profundidad y errores. Hacer lo mismo con Deep Research de OpenAI para tener referencia.
Coste por hora bajo control: un agente que corre 8 horas consume muchos tokens. Definir presupuesto máximo por encargo y cap automático antes de delegar el primer proyecto serio. La factura sorpresa es el patrón típico el primer mes.
Revisar términos de privacidad y residencia de datos: Sakana es laboratorio comercial relativamente nuevo con sede en Tokio. Para datos sensibles (clientes, estrategia, due diligence) leer bien los términos, confirmar dónde se procesan y decidir si entra en el flujo o se queda en proveedor con compliance GDPR ya probado.