SemiAnalysis: una suscripción de Claude Max de 200$ le cuesta a Anthropic hasta 8.000$ de cómputo al mes. ChatGPT Pro, hasta 14.000$

SemiAnalysis publicó esta semana un análisis que cuantifica algo que en la industria se intuía desde hace meses: las suscripciones de los grandes labs van vendidas a pérdida para los power users. Los números:

  • Un plan Claude Max de 200$/mes da acceso a claude-opus-4-8 y claude-sonnet-4-6 por tareas que costarían hasta 8.000$ a precio de API si se ejecutaran directamente.
  • ChatGPT Pro al mismo precio puede costarle a OpenAI hasta 14.000$ de cómputo.
  • Para un developer haciendo coding agéntico, la suscripción es una ventaja de coste de 40-70x respecto a tirar de la API.

Metodología

SemiAnalysis compró una suscripción de cada tier de OpenAI y Anthropic, ejecutó workflows agénticos hasta agotar los límites semanales y mapeó el consumo real de tokens contra las tarifas públicas de API. Es un escenario techo, no la media. Pero explica por qué a Anthropic se le ha caído alguna vez el servicio cuando los desarrolladores ponen Claude Code en bucle, y por qué los labs llevan meses revisando límites semanales en silencio.

Un detalle relevante del análisis: la economía de Anthropic es más sana que la de OpenAI dentro del mismo precio. Sus costes de inferencia por token son más bajos respecto a sus topes de suscripción, lo que les permite aguantar más uso pesado antes de cruzar el umbral de pérdida. Ambos pierden dinero con power users; OpenAI pierde más rápido.

Lo técnico: por qué los topes son la pieza clave

Cuando una suscripción de 200$ tapa hasta 14.000$ de cómputo, el único freno es el límite semanal de uso. Ese límite es la palanca que los labs pueden mover sin tocar precio. Y es lo que están moviendo: en los últimos seis meses Anthropic ha ajustado dos veces los topes de Claude Max (a la baja en uso semanal, sin avisos llamativos). OpenAI ha hecho lo mismo con ChatGPT Pro. SemiAnalysis apuesta por otra palanca complementaria: reservar los modelos más nuevos y caros (opus 4.9, GPT-5.6) para API, créditos de uso y enterprise, dejando a los suscriptores con modelos un escalón por debajo.

Qué pasa en paralelo

Un exclusivo del Wall Street Journal de la misma semana añade contexto: OpenAI está considerando recortes drásticos en los precios de tokens vía API, anticipando un movimiento similar de Anthropic. La razón de fondo es la misma de siempre, capturar cuota antes de que la salida a bolsa de OpenAI obligue a transparencia total sobre márgenes. Recortar precio justo antes de una IPO comprime más el resultado, pero le cierra la puerta a la competencia.

Y para completar el cuadro, OpenAI anunció la adquisición de Ona, una startup de infraestructura cloud cuyo equipo se va a integrar en Codex. Es la quinta operación de consolidación que hace OpenAI en lo que va de año.

Por qué importa para un founder español

Tres lecturas concretas si tienes Claude o GPT en producción.

Primero, los precios de tokens van a bajar. Si tienes un cálculo de coste mensual hecho hace 6 meses, te va a salir más barato a finales de este año. Vale la pena recalcular viabilidad de proyectos que descartaste por presupuesto entonces. En Barner hemos rehecho dos veces el coste estimado del clasificador de tickets en lo que llevamos de año, y la diferencia es real.

Segundo, los topes de uso de suscripciones van a tensarse. El subsidio no es sostenible y los labs lo saben. Si tu equipo depende de Claude Max o ChatGPT Pro con uso intensivo (desarrolladores, analistas que tiran muchas conversaciones largas), tiene sentido empezar a migrar las cargas pesadas a la API por adelantado en lugar de esperar a que te recorten límites en una actualización silenciosa.

Tercero, la consolidación se acelera. OpenAI comprando Ona no es la última adquisición. Los labs frontera necesitan controlar más capas de la stack (chips, datacenter, coding) para defender márgenes. Esperar más operaciones de este tipo en los próximos trimestres.

Qué hacer esta semana

  • Auditar la factura mensual de IA y separar uso de suscripciones (Claude Max, ChatGPT Pro, Plus) del uso por API. Si la suscripción cubre 40-70x lo que pagas, asume que el tope se va a apretar y planifica el cambio antes de que llegue forzado.
  • Aislar la lógica del producto del modelo concreto. Cuando los precios cambien, el ajuste se hace cambiando un parámetro de configuración, no rediseñando el sistema. Quien lleva un año atado a un solo proveedor lo pagará caro.
  • Recalcular el ROI de los proyectos que aparcaste hace 6 meses por coste de tokens. A los precios actuales (y con la caída prevista para fin de año), probablemente vuelven a ser viables.

Cómo entender la pelea de fondo

Para acabar de cuadrar la foto conviene zoom out. OpenAI y Anthropic no están compitiendo solo por suscriptores: están compitiendo por quedarse con la stack completa. OpenAI con Stargate (chips + datacenter + producto) y la compra de Ona (infraestructura cloud). Anthropic con su acuerdo con Amazon (Trainium + AWS) y su alianza con Google. La razón es simple: cuando la inferencia es el 60-70% del coste operativo, controlar las capas de abajo es la única forma de defender margen a largo plazo.

El subsidio de 8.000$ o 14.000$ por suscriptor pesado es la cara visible. Detrás está una carrera por ser el primero que pueda servir esos tokens a coste casi cero (chip propio, modelo más eficiente, datacenter más barato). Quien lo consiga primero pone precios que los demás no pueden igualar.

Qué leer entre líneas en SemiAnalysis

Hay una predicción del análisis que conviene tener anotada: lo más probable, según SemiAnalysis, no es que los labs suban precios de las suscripciones (es muy impopular). Es que segmenten por modelo. Las suscripciones se quedan con la generación anterior (Opus 4.7, GPT-5.4) y los modelos frontera (Opus 4.9, GPT-5.6) se reservan para API, créditos de uso y enterprise.

Si esa predicción se cumple, el plan de juego para una empresa española cambia: la diferencia entre estar en suscripción y estar en API no será solo de límites sino de calidad de modelo. Y eso te obliga a decidir, por flujo, cuál es crítico (API) y cuál es secundario (suscripción).