Gemini 3.5 Flash añade computer use: el modelo barato de Google ya controla pantalla

Google integra computer-use de forma nativa en Gemini 3.5 Flash

Google añade computer use a Gemini 3.5 Flash desde el 24 de junio de 2026. Es decir, el modelo barato y rápido de Google ahora puede controlar pantalla, rellenar formularios y navegar, sin tener que enrutar a un modelo aparte. El benchmark OSWorld-Verified que publica Google: 78,4 puntos, a 0,3 de GPT-5.5 (78,7). El precio base se queda en 1,50 USD por 1M tokens de input y 9 USD por 1M de output.

Qué cambia, en seco

Hasta ahora computer use de Google vivía en un modelo aparte (gemini-2.5-computer-use) que había que invocar específicamente. Ahora va nativo dentro del modelo principal de la tier Flash. El mismo modelo hace reasoning, function calling, Google Search grounding, Maps y control de pantalla sin enrutar entre modelos. Context window: 1 millón de tokens.

El acceso es vía Gemini API y Gemini Enterprise Agent Platform. La demo pública está en gemini.browserbase.com (hosted por Browserbase) y el código de referencia en GitHub `google-gemini/computer-use-preview`.

Tres entornos soportados, paso por delante de Claude

Browser (clicks, typing, scroll, navegación), mobile (Android, control de apps), desktop (cursor a nivel de sistema operativo). Es un paso por delante de Claude computer use (octubre 2024), que se centró en browser y desktop. La diferencia más importante no es el alcance, es el posicionamiento: Anthropic lanzó computer use en su tier premium Sonnet; Google lo mete en su tier barato Flash. Cambia el cálculo económico de automatizaciones web a nivel masivo.

Features de API útiles: campo `intent` que explica el razonamiento del modelo por cada acción, detección nativa de prompt injection, políticas de seguridad configurables.

Cautela razonable con los benchmarks

Los 16 puestos de OSWorld-Verified son self-reported, ninguno verificado por tercero a fecha de junio 2026. Un estudio de Berkeley RDI de 2026 mostró que 8 benchmarks mayores (OSWorld, WebArena, SWE-bench y otros) se pueden gamear hasta casi el 100% sin resolver las tareas reales. La validación independiente sigue siendo pendiente.

Por qué importa para founder español

La automatización de tareas web (rellenar formularios repetitivos, navegar SaaS sin API, scrapear con login, ejecutar workflows sobre interfaces antiguas) deja de ser proyecto de desarrollo y empieza a ser llamada de API barata.

Para un equipo de operaciones de empresa mediana con 5-10 procesos manuales sobre interfaces sin API (portales de proveedores, ERPs antiguos, herramientas internas), la cuenta cambia. Donde antes había que elegir entre RPA caro o desarrollo a medida, ahora hay tercera vía: una llamada al modelo que ejecuta el flujo end-to-end por céntimos.

Yo personalmente ya estoy testeando reemplazar varias automatizaciones de n8n por scripts que llaman al modelo directamente cuando la tarea es un workflow simple. No siempre gana el modelo (n8n sigue siendo más predecible para flujos estables), pero para tareas con variabilidad real, computer use en Flash empieza a tener sentido.

Qué hacer esta semana

  • Si haces RPA o tienes contrato con UiPath/Automation Anywhere: hora de pedir presupuesto comparado contra Gemini Flash computer use. Calcula al menos 3 procesos y compara TCO a 12 meses.
  • Si tu equipo de operaciones tiene 5+ procesos manuales en portales externos: haz un piloto de 2 semanas con Flash sobre el proceso más doloroso. Está en preview pero los costes son tan bajos que el ROI sale a las pocas horas.
  • Si estás eligiendo modelo para tu agente: probar Flash al mismo tiempo que Claude Sonnet en tu caso real. La diferencia de coste justifica las pruebas.

Y un último apunte sobre los precios. El blog oficial de Google no aclara si computer use se factura al precio base de Flash o si se enruta por la tier Gemini 2.5 Pro (una fuente secundaria menciona esto último sin confirmar). Antes de meter Flash con computer use en producción, revisa tu factura de los primeros días para confirmar el modelo de cobro real.