Tiembla la hegemonía de ChatGPT por un desarrollo chino que está liderando las listas de descargas tanto en el gigante asiático como en Estados Unidos: se trata de DeepSeek, la última alternativa de inteligencia artificial (IA) que ha explotado gracias a una innovadora apuesta por el código abierto, bajos costos y eficiencia.
Esta irrupción inesperada amenaza con poner en jaque la supremacía de los modelos estadounidenses de IA, un efecto que disparó la volatilidad en Wall Street, debido a las dudas sobre las valuaciones de las empresas tecnológicas en EE. UU.
DeepSeek desafía la idea convencional de que las empresas de IA necesitan chips informáticos caros y de última generación para entrenar los mejores sistemas. Aunque DeepSeek no tiene la misma potencia financiera que gigantes como Alphabet y Meta Platforms, sus modelos se encuentran a la par de los de sus principales rivales estadounidenses.
Según la empresa china, es posible utilizar chips menos avanzados combinados con técnicas innovadoras de entrenamiento de modelos, lo que permite resultados muy favorables en IA. Este enfoque ha generado dudas sobre la necesidad de chips como los de Nvidia y otros microprocesadores caros para realizar tareas de IA.
DeepSeek-R1, lanzado el 20 de enero, se ha situado en el primer puesto en las listas de descargas gratuitas en App Store tanto en China como en Estados Unidos, superando a ChatGPT. Este modelo es comparable con el o1 de OpenAI en la resolución de problemas matemáticos, programación e inferencia del lenguaje natural.
El modelo de DeepSeek es de código abierto, lo que permite que cualquier persona lo examine, modifique y desarrolle según sus necesidades. Este enfoque ha generado un notable impacto en la comunidad de desarrolladores, que destaca su eficiencia y bajo costo.
Este avance llega justo después de que EE. UU. impusiera restricciones a la exportación de chips de alto rendimiento a China, lo que Pekín ha respondido con llamados a la innovación.
DeepSeek logró entrenar su modelo con un presupuesto de 5,57 millones de dólares utilizando procesadores gráficos H800 de Nvidia. Este costo representa menos de una décima parte del gasto en el entrenamiento de modelos como el GPT-4 de OpenAI.
Con este enfoque de bajo costo y eficiencia, DeepSeek está en vías de redefinir las reglas de la IA y desafiar el dominio de EE. UU. en este campo.