DeepSeek se mete de lleno en la carrera de la IA

Las capacidades de la inteligencia artificial avanzan rápidamente. El 20 de enero, la empresa china DeepSeek presentó dos nuevos modelos lingüísticos, DeepSeek-R1 y DeepSeek-R1-Zero. Estos rivalizan en razonamiento con líderes del sector como OpenAI y GPT-4. Las innovadoras técnicas de entrenamiento de DeepSeek podrían ser adoptadas por otros desarrolladores para mejorar la eficiencia, aunque estos modelos siguen requiriendo una inversión significativa, ya que son cruciales para los agentes de IA. Los avances logrados gracias a la optimización, más que al aumento de los recursos informáticos, indican que el desarrollo de modelos de IA aún está en pañales.

A largo plazo, estos avances deberían acelerar la adopción de la IA en las empresas, haciendo que los chatbots y otros agentes sean más inteligentes y baratos. La escasez de recursos informáticos está impulsando la innovación. Los rumores sugieren que el desarrollo de los modelos R1 o R1-Zero costó 5,6 millones USD, frente a los más de 1.000 millones de otros modelos de vanguardia. Sin embargo, esta cifra de 5,6 millones se refiere al modelo DeepSeek-V3, construido con GPU Nvidia H800 (y, según los rumores, también con GPU H100), y no incluye ningún otro coste de investigación y desarrollo (según DeepSeek). La innovación radica, por tanto, en la reducción de los costes de formación e inferencia, lo que hace más accesibles los servicios de IA, desde los coches hasta los teléfonos inteligentes.

El software se está beneficiando de mayores capacidades a menor coste, lo que es una señal positiva para el sector. Tras un periodo de caída, la tecnología podría recuperarse en los próximos días, sobre todo con los resultados de Meta Platforms y Microsoft que se esperan esta semana. La innovación de DeepSeek, si se confirma, se caracteriza por la reducción de las necesidades de inferencia, lo que a su vez reduce la necesidad de memoria y semiconductores. Además, los precios ofrecidos a los clientes finales podrían ser entre un 50 y un 80% más bajos que los actuales, según los analistas de Bank of America.

Los avances en el desarrollo de modelos deberían beneficiar a las empresas de software, muchas de las cuales ya han integrado la IA en sus productos. Estas mejoras permiten crear soluciones más potentes y menos costosas para las empresas. La solidez de los sistemas de explotación de modelos es esencial para las aplicaciones generadoras de ingresos, que aún están en pañales. Se espera que las empresas empiecen a proporcionar datos cuantitativos sobre los ingresos incrementales relacionados con la IA en la segunda mitad de 2025.

Los principales ganadores de la llegada de DeepSeek, en el sentido de que una mayor eficiencia de la IA podría conducir a un mayor uso de sus aplicaciones, son: AppLovin, MongoDB, Snowflake, Hubspot, Salesforce, Workday, Datadog, Gitlab, Okta, Cloudflare, Elastic, Zscaler, Samsara, Confluent, Monday.com, Dynatrace, SentinelOne, Crowdstrike, Atlassian, Gartner, Adobe e Instacart.

China se globaliza en IA

China es actualmente el único mercado centrado en la eficiencia de los modelos lingüísticos (LLM) debido a las restricciones de chips impuestas por la administración Trump. Estas limitaciones han impulsado a Pekín a acelerar su innovación. Las empresas más afectadas en Asia son las que participan en la cadena de suministro de IA, como fabricantes de GPU, ODM de servidores y productores de PCB. Esta situación podría beneficiar a las empresas chinas de internet, pero por razones diferentes a las estadounidenses. Para las empresas de internet estadounidenses, podría suponer una reducción de los gastos de capital. Para las empresas chinas, en cambio, demuestra que DeepSeek ha logrado desarrollar un modelo de IA de éxito. Entre los principales beneficiarios en Asia figuran Tencent, Alibaba, Kuaishou Technology, Meitu, Sensetime y Beijing Fourth Paradigm Technology.