Ayer nos sorprendieron las noticias en la prensa generalista y económica con titulares del tipo «Terremoto en los mercados por el fenómeno del modelo de inteligencia artificial chino DeepSeek», «DeepSeek, la IA china que ha dejado en evidencia a EE. UU.» o «Wall Street reacciona a la irrupción de DeepSeek: Nvidia cae un 15% y sus pérdidas superan los 530.000 millones de dólares».
Para comprender lo que ha «roto» DeepSeek esta semana, hay que recordar los principales problemas que tienen los modelos «transformer» (de ahí la T de GPT), que son la base de ChatGPT y toda la familia de productos GPT.
El gran problema de estos modelos es que son contrarios al principio de economía cognitiva, que es el que utiliza nuestro cerebro para funcionar. Es decir, cada nuevo modelo es más potente a costa de más datos, más computación y más energía. Esta dinámica es insostenible y ha planteado enormes desafíos para la industria: ¿cómo equilibrar resultados del modelo, costes computacionales y gasto energético?
Lo que ha hecho DeepSeek es demostrar que ese equilibrio es posible con una estrategia de entrenamiento innovadora.

Un terremoto en los mercados
DeepSeek R1, la versión que ha generado esta tormenta, fue presentada el 20 de enero. Desde el primer día, los expertos destacaron tanto su potencial como sus limitaciones, pero lo que sucedió la semana pasada fue un ejemplo perfecto de cómo las dinámicas de mercado responden más a la confianza que al conocimiento técnico.
El anuncio de DeepSeek coincidió con una declaración de Trump y sus socios, entre ellos OpenAI, sobre una millonaria inversión en IA que posicionaría a EE. UU. como líder mundial en el sector. Sin embargo, la irrupción de DeepSeek puso en evidencia una cuestión clave: ¿es posible superar el enfoque tradicional de modelos grandes y costosos para avanzar hacia una inteligencia artificial más sostenible?
La reacción de los mercados no se hizo esperar. Nvidia, cuya capitalización está profundamente ligada a la venta de hardware para IA, sufrió una caída del 15%, lo que representó pérdidas superiores a 530.000 millones de dólares. Esto refleja cómo cualquier avance disruptivo puede generar volatilidad en un sector donde las expectativas ya son altísimas.

¿Qué hace diferente a DeepSeek?
El verdadero hito de DeepSeek no radica solo en sus resultados, sino en cómo los ha logrado.
Menos datos, más eficiencia: DeepSeek utiliza un conjunto de datos «destilado», es decir, un subconjunto más pequeño y refinado en comparación con los enormes volúmenes de datos que suelen necesitar los modelos transformer. Esto reduce drásticamente los costes computacionales y energéticos, pero introduce un nuevo desafío, los sesgos.
Menos datos implican necesariamente la agrupación de respuestas o la exclusión de otras, lo que puede comprometer la diversidad y la equidad en los resultados del modelo.
Técnica de mezcla de expertos: En lugar de entrenar un modelo monolítico, DeepSeek divide las tareas entre varios módulos especializados, que colaboran de forma eficiente para generar respuestas. Este enfoque distribuye la carga computacional y reduce redundancias, haciéndolo mucho más sostenible.
Sin embargo, estas innovaciones plantean una pregunta crucial: ¿qué costes éticos tiene esta eficiencia?

El origen de los datos como dilema ético
Uno de los aspectos más controvertidos de DeepSeek es el origen de sus datos. Según investigaciones recientes, gran parte de su entrenamiento se basó en conjuntos de datos públicos que incluían texto generado por modelos como GPT-4 a través de ChatGPT. Esto plantea dos problemas fundamentales:
Uso de datos sintéticos: Tanto los modelos de DeepSeek como de otros, incluidos OpenAI y Gemini, están recurriendo cada vez más a datos generados por IA para entrenar nuevas generaciones de modelos. Esto crea un ciclo cerrado donde los sesgos existentes no solo se perpetúan, sino que se amplifican.
Costes de acceso y transparencia: Con un presupuesto limitado, resulta improbable que DeepSeek haya podido acceder a datos a gran escala sin recurrir a fuentes generadas por terceros. Esto plantea preguntas sobre la transparencia del proceso y la calidad de los datos utilizados.
El ciberataque a DeepSeek, la guerra apenas comienza
La historia de DeepSeek no termina aquí. Ayer, su sitio web sufrió un ciberataque que la dejó inoperativa durante varias horas. Aunque no se ha identificado al responsable, este ataque subraya cómo la rivalidad en el ámbito de la IA no solo se libra en el terreno comercial, sino también en el tecnológico y político.

A donde vamos
DeepSeek ha demostrado que es posible construir modelos más sostenibles, pero a costa de comprometer diversidad, transparencia y ética en los datos. Si este es el camino hacia el futuro de la IA, debemos preguntarnos: ¿qué estamos ganando realmente y qué estamos sacrificando en el proceso?
La disrupción tecnológica siempre trae consigo riesgos y oportunidades, pero en el caso de la inteligencia artificial, las implicaciones trascienden los mercados y tocan aspectos fundamentales de la sociedad y la economía del conocimiento.
DeepSeek ha roto con la dinámica de crecimiento exponencial que definía la evolución de la IA, probando que es posible optimizar el gasto energético y computacional sin comprometer los resultados. Sin embargo, este avance no puede eclipsar un aspecto clave, y es la necesidad de un control riguroso y estratégico de los datos.
A medida que la IA depende cada vez más de datos sintéticos, surge un desafío crítico, y es que si estos datos perpetúan sesgos existentes o carecen de diversidad, ¿estamos avanzando realmente? ¿o solo siendo más eficientes? Además, en este contexto, los datos reales se convierten en un recurso estratégico de enorme valor, y subestimarlos o ceder su control podría ser un error de proporciones incalculables.
Lo que queda claro es que en la IA, la sostenibilidad, la reducción de sesgos y el control de los datos no son elementos intercambiables. Antes el desafío era la sostenibilidad, ahora son los sesgos y el uso ético de los datos. El dato sigue siendo el eje principal que sustenta cualquier modelo de IA, y aunque los datos sintéticos sean una solución eficiente, no pueden ser la única respuesta. La clave está en encontrar el equilibrio entre eficiencia, diversidad y ética, porque en ese equilibrio reside el verdadero potencial transformador de la inteligencia artificial.
Por lo pronto, el presidente de Estados Unidos, Donald Trump, ha calificado el ascenso de la empresa china DeepSeek como «una llamada de atención» para la industria tecnológica estadounidense, al que ha invitado a competir “El lanzamiento de la IA DeepSeek por parte de una empresa china debería ser una llamada de atención para nuestras industrias de que necesitamos estar completamente enfocados en competir”.
