Google ha tenido que limitar el acceso de Meta a los modelos Gemini porque no tiene suficiente capacidad de cómputo para servir a todos sus clientes. Meta usaba Gemini para funciones operativas internas (moderación de contenido, detección de estafas) y ha tenido que dar instrucciones a sus empleados para consumir tokens con más cuidado. Pausa y relee: Meta, una empresa con 3.900 millones de usuarios activos, ha tenido que racionar su consumo de IA porque su proveedor no puede abastecer.
La cifra que da dimensión al problema
Para paliar la escasez, Google ha cerrado un acuerdo con SpaceX: 920 millones de dólares al mes por acceso a 110.000 GPUs Nvidia. Google lo describe como capacidad temporal mientras escala su propia infraestructura. Para poner el número en contexto: 920M$/mes son 11.040 millones al año solo en alquiler de GPUs a un tercero. Y Google lo considera un parche.
SpaceX tiene GPUs porque las compró para sus propias operaciones de IA (Starlink, sistemas de vuelo autónomos, análisis de telemetría). Que ahora las alquile a Google a 920M$/mes dice algo sobre dónde están los márgenes reales de la industria en este momento: no en el software, en el hierro. SpaceX compró esas GPUs hace 18-24 meses a precios pre-escasez. El retorno que están sacando alquilándolas al mercado es probablemente superior al 200% anualizado. Si alguien hubiera invertido en GPUs como activo financiero hace dos años, habría batido al S&P 500 por mucho.
Anthropic también está alquilando capacidad de datacenter a SpaceX. SpaceX se está convirtiendo, por la puerta de atrás, en uno de los proveedores de infraestructura de IA más relevantes del mercado. Un escenario que nadie habría predicho hace dos años.
La respuesta de Meta
Meta está pivotando workloads a Muse Spark, su modelo interno, para reducir dependencia de proveedores externos. La empresa tiene comprometidos entre 115.000 y 135.000 millones de dólares en capex para 2026 y ha reasignado 7.000 empleados a posiciones de IA. El presupuesto de capex de Meta supera el PIB de más de 100 países. Y aun así necesita modelos externos para cubrir operaciones básicas.
La dependencia de Meta en Gemini para moderación de contenido es el detalle más revelador. Meta tiene Llama 4 (open source, de primera línea), pero para funciones operativas estaba usando Gemini. La explicación probable: Llama es bueno en generación pero Google ha optimizado Gemini para clasificación y detección a escala, que es exactamente lo que necesitas para moderar miles de millones de posts al día. Cuando tu modelo propio no sirve para tu propia operación más grande, la diferencia entre un modelo bueno y un modelo especializado queda en evidencia.
El juego de las tres bandas
Si miramos la foto completa de esta semana, lo que emerge es un triángulo de dependencias que hace dos años no existía:
- Google necesita GPUs de SpaceX para servir a sus propios clientes.
- Meta necesita Gemini de Google para moderar su plataforma, y cuando Google le corta acceso, tiene que pivotar de urgencia a un modelo interno.
- Anthropic necesita data centers de SpaceX para entrenar sus modelos, mientras el gobierno de EEUU decide cuándo y a quién puede vender acceso.
- SpaceX cobra de todos: de Google, de Anthropic, y prueba su propio Grok 4.5 en interno (como hemos contado hoy).
La infraestructura física se ha convertido en el cuello de botella real de la industria de IA. Los modelos mejoran cada 3-4 meses. Los data centers tardan 18-24 meses en construirse. Esa asimetría temporal es lo que está detrás de todas las noticias de infraestructura de esta semana.
El elefante en la habitación: consumo energético
110.000 GPUs solo en el acuerdo Google-SpaceX. Meta presupuestando 135.000M$ en capex. Big Tech con 725.000M$ en infraestructura planificada. Todo esto necesita electricidad. Los informes de Naciones Unidas proyectan que los data centers casi doblarán su consumo eléctrico a 945 TWh para 2030, equivalente al consumo total de Japón. La IA supondría el 40% de esa carga. Y el agua para refrigeración: 9.300 millones de litros anuales.
En España, donde el debate energético ya es tenso (precio del kWh, dependencia renovable, oposición local a parques solares), la llegada de data centers de IA a gran escala va a añadir presión. Madrid y Barcelona están en la lista corta de varias empresas de infraestructura de IA para expandir en Europa. Si eso se concreta, veremos debates locales sobre suelo industrial, consumo de agua y red eléctrica que hoy no están en la agenda.
Qué leer aquí si diriges una empresa
El cuello de botella de la IA en 2026 no es el modelo, es el hierro debajo. Las implicaciones prácticas para empresas de 5 a 500 millones:
- Precios de API no van a bajar al ritmo que esperabas. Si los propios labs no tienen suficiente cómputo para servir a sus clientes grandes, los precios van a mantenerse o subir en momentos de pico de demanda. Planifica tu presupuesto de IA con un margen del 15-20% por encima de lo que gastas hoy.
- Diversificar proveedor es más necesario que nunca. Si Meta puede quedarse sin acceso a Gemini, una empresa mediana también. Tener fallback entre Claude, GPT y Gemini (o modelos open source en infra propia) ya es higiene operativa, no sofisticación técnica.
- La escasez de GPUs está revalorizando a Nvidia y a las memorias. Micron +296% en lo que va de año, SanDisk +780%. No es especulación: es demanda real de hardware que físicamente no da abasto. Si inviertes, mira a la cadena de suministro de IA antes que a los labs.
- Construir in-house tiene una dimensión nueva de justificación. Cuando el argumento para construir capacidad propia era solo 'reducimos costes', era difícil de vender al comité de dirección. Cuando el argumento es 'nuestro proveedor puede racionarnos el acceso mañana', la conversación cambia. Lo que Meta está haciendo con Muse Spark (pivotar a modelo interno de urgencia) es lo que cualquier empresa grande debería tener en su plan de contingencia.
Mientras tanto, Meta y Google están librando una guerra silenciosa de recursos que define quién puede construir IA a escala y quién depende de otro para hacerlo. SpaceX, de rebote, se lleva 11.000M$ al año solo por tener GPUs disponibles en el momento correcto.