Meituan libera LongCat-2.0: modelo de código de 1,6 billones de parámetros entrenado solo con chips chinos

Meituan libera LongCat-2.0: modelo de código de 1,6 billones de parámetros entrenado solo con chips chinos
Fuente: venturebeat.com

Meituan, el gigante chino del reparto a domicilio, ha liberado en abierto LongCat-2.0, un modelo de código de 1,6 billones de parámetros entrenado por completo con chips chinos. No es un experimento: lidera el ranking de OpenRouter y se acerca a los modelos de frontera en programación con agentes, sin haber tocado una sola GPU de Nvidia.

Puntos clave

  • 1,6 billones de parámetros con arquitectura Mixture-of-Experts (MoE): activa solo entre 33.000 y 56.000 millones de parámetros por consulta, así que rinde sin encender todo el modelo cada vez.
  • Ventana de contexto de 1 millón de tokens, pensada para razonar sobre bases de código enteras.
  • Benchmarks: 59,5 en SWE-bench Pro, 70,8 en Terminal-Bench y 77,3 en SWE-bench Multilingual.
  • Pesos abiertos en Hugging Face, bajo la organización meituan-longcat. Cualquiera puede descargarlo.

Qué significa MoE y pesos abiertos

Dos términos que conviene aterrizar. Mixture-of-Experts es una forma de montar el modelo en la que, en vez de usar los 1,6 billones de parámetros para cada respuesta, se enruta cada consulta a un subconjunto de expertos especializados. Por eso puede ser gigante y a la vez barato de ejecutar: solo enciende la parte que hace falta. Y pesos abiertos quiere decir que Meituan ha publicado el modelo entero para que lo descargues, lo corras en tu propia infraestructura y lo ajustes a tu gusto, sin pasar por una API de pago ni pedir permiso a nadie.

Lo de verdad relevante: entrenado sin Nvidia

El titular técnico es el 1,6 billones. El titular geopolítico es cómo lo entrenaron. Meituan dice que usó un clúster de 50.000 tarjetas de superpods de ASIC chinos domésticos. No nombró al fabricante, pero el uso de la librería HCCL de Huawei apunta a sus chips Ascend, probablemente los 910C. Es decir, un modelo de código casi de frontera entrenado del todo fuera del hardware de Nvidia, justo lo que los controles de exportación de EEUU intentan frenar. La lectura es incómoda para quien apostaba a que el muro de los chips iba a mantener a China por detrás: si puedes entrenar esto con silicio propio, el muro tiene agujeros.

Y lo hace una empresa de reparto

Hay un detalle que dice mucho del momento. Meituan no es un laboratorio de IA, es la mayor plataforma de reparto de comida de China, con cientos de millones de usuarios. Que una empresa así saque un modelo de código que lidera OpenRouter, el sitio donde los desarrolladores comparan y eligen modelos por rendimiento real, enseña dos cosas. Una, que en China hay más de una casa capaz de entrenar en la frontera, no solo los sospechosos habituales. Dos, que estas empresas tienen datos, dinero y ahora chips propios para hacerlo. El SWE-bench Pro mide si el modelo resuelve tareas reales de ingeniería de software, y el Terminal-Bench, si sabe manejarse en una terminal como un desarrollador. Sacar 59,5 y 70,8 ahí no es marketing, es capacidad de trabajo de verdad.

Por qué importa

Para una empresa que programa con IA, aquí hay algo muy concreto: un modelo de código casi de frontera, abierto y gratis, que puedes correr en tu propia infraestructura sin depender de una API de pago ni de una empresa estadounidense. Para tareas sensibles donde no quieres mandar tu código a un tercero, eso es una opción real. Y la señal de fondo importa aunque no toques LongCat: cada modelo abierto y competente que sale de China empuja hacia abajo el precio de la IA de código para todos. Cuantas más alternativas serias hay, menos te atas a un solo proveedor y menos pagas por token. El que va con un único modelo de pago encadenado es el que se queda sin margen de maniobra.


Relacionado