Las empresas top gastan 7.500$ al mes por empleado en IA y empiezan a apretar el cinturón

TechCrunch ha publicado el 10 de junio los datos del Ramp AI Index: las empresas top en adopción de IA (el 1% que Ramp llama 'AI-pilled') gastan ya 7.500$ al mes por empleado en herramientas de IA. El top 10% se queda en unos 611$ al mes, y la mediana del mercado en 11,38$, prácticamente el coste de un asiento enterprise plan. Y Sam Altman ha reconocido en público que algunos clientes le están diciendo que el coste de IA es un problema enorme, algo que en 2025 no aparecía en las conversaciones.

El cambio de mensaje, en seco

2025 fue el año de 'experimenta libremente, paga lo que haga falta, no te quedes atrás'. La directriz interna en buena parte de las empresas grandes era esa. 2026 está siendo el año donde el CFO entra a la sala y pregunta cuánto se está gastando exactamente y qué se está obteniendo a cambio. No es un cambio dramático. Es el ciclo normal de cualquier tecnología cuando deja de ser experimento y empieza a ser línea de presupuesto.

Los anecdotarios del artículo son llamativos. Un ejecutivo de Nvidia ha admitido que sus costes de cómputo ya superan los salarios. Mercor reconoce gastar más en tokens para sus agentes internos que en nómina. Peter Steinberger, creador de OpenClaw, presumió de haberse gastado 1,3M$ en tokens él solo en un mes. La parte sobria del dato: el top 1% aún gasta menos de la mitad de lo que cuesta un ingeniero de software medio en EEUU (unos 16.000$ al mes con cargas).

La señal institucional

La Linux Foundation lanzó en junio de 2026 la Tokenomics Foundation, con respaldo de Oracle, Google, Microsoft y JPMorgan Chase, para crear estándares abiertos de gestión de coste de IA. Cuando los hyperscalers y un banco grande se sientan a estandarizar métricas de coste, la disciplina deja de ser opcional. El mensaje implícito: pronto los CFOs van a tener herramientas comparables para auditar gasto de IA entre proveedores, igual que las tienen para cloud.

Lo que la mayoría está haciendo mal

Confundir gastar mucho en IA con usar IA bien. No son lo mismo. Hay equipos que se dejan 10.000$ al mes en API calls porque tienen montado un loop ineficiente que repite consultas con prompts mal optimizados. Y hay equipos que con 200$ al mes resuelven el mismo problema, porque construyeron una capa de caché y un sistema de routing entre modelos. El propio TechCrunch destaca que el patrón del top 1% es exactamente ese: mezclar y combinar entre múltiples modelos frontera y plataformas con acceso a open source barato.

Tres palancas concretas que aplican a cualquier empresa que ya esté gastando más de 2.000€ al mes en IA:

  • Routing por tarea: Sonnet o GPT-5-mini para extracción de datos, reformateo, clasificación. Opus o GPT-5 solo para tareas que de verdad requieren razonamiento profundo. La diferencia de coste por millón de tokens entre tier alto y bajo es de 10x. Aplicado bien, baja el coste mensual entre 40% y 70% sin perder calidad.
  • Caché de respuestas y context caching: si tus consultas comparten contexto largo (documentación interna, system prompt extenso), prompt caching corta el coste hasta 90% en las llamadas repetidas. Anthropic y OpenAI ya lo soportan. Aplica de la primera semana.
  • Medición real de output: el CFO no quiere ver 'tokens consumidos'. Quiere ver 'horas ahorradas equivalentes al sueldo de quien las hubiera hecho'. La conversión la tiene que hacer el responsable de la implementación. Si no, el presupuesto de IA se convierte en discusión emocional en lugar de discusión de retorno.

Sobre on-device, lo que añade Intel

Olena Zhu, Head of AI Solutions en Intel, dice algo que merece la pena tener en mente: mientras todo el mundo persigue modelos cloud más grandes, el moat real es la capa de control on-device. Traducido a empresa: los modelos pequeños corriendo en local (Llama, Phi, Mistral pequeño) ya son lo bastante buenos para tareas concretas. Para extracción de datos estructurados, clasificación de tickets o limpieza de texto, un modelo de 7B corriendo en tu propio servidor te cuesta amortización de hardware una vez, no coste por token cada mes.

La lectura honesta para founders españoles

Si tu factura de IA está creciendo 20% al mes sin que el output crezca al mismo ritmo, es momento de meter freno y revisar arquitectura. Probablemente con un fin de semana de trabajo bajas el coste a la mitad. Si tu factura es pequeña, no la subas por subirla. Las empresas que están ganando dinero con IA no son las que más tokens consumen, son las que más output verificable producen por euro gastado.

Qué hacer esta semana

  • Saca el desglose de factura de IA por equipo y por workflow. Si no puedes hacerlo, ese es el primer problema a arreglar.
  • Mete prompt caching y routing entre tiers en el workflow que más consume. Esos dos cambios suelen pagar la inversión en una semana.
  • Define una métrica de output (tickets resueltos, leads cualificados, contratos generados) y publícala junto al coste mes a mes. La conversación con dirección cambia el día que tienen los dos números.