bhide11_Anthony KwanGettyImages_deepseek Anthony Kwan/Getty Images

¿Es DeepSeek una amenaza?

CAMBRIDGE – Se suele considerar a Thomas Edison, el telegrafista autodidacta devenido emprendedor, como el mayor inventor de todos los tiempos; mientras que si no fuera por los vehículos eléctricos de Elon Musk, pocos se acordarían de Nikola Tesla, que trabajó para una empresa de Edison en París antes de emigrar a Estados Unidos. Pero fueron los avances de Tesla con la corriente alterna (CA), y no la tecnología de corriente continua (CC) de Edison, los que pusieron la electrificación masiva al alcance de todos. Con los costos prohibitivos de la CC, la electrificación urbana de Edison hubiera sido un juguete de ricos, como muchos de sus otros inventos.

¿Serán los modelos de inteligencia artificial DeepSeek del inversor chino Liang Wenfeng un avance similar, o son fraudes como la fusión fría y la superconductividad a temperatura ambiente? Y si se confirman, ¿debería Estados Unidos considerarlos una amenaza mortal o un regalo para el mundo?

Como muchas tecnologías transformadoras, la IA llevaba muchas décadas evolucionando antes de que el lanzamiento de ChatGPT por OpenAI a fines de 2022 desatara la manía actual. Mejores algoritmos, dispositivos complementarios como los teléfonos móviles y una computación en la nube más barata y potente habían difundido el uso de la tecnología sin que casi se notara. Un proceso de prueba y error había mostrado las áreas dónde la IA podía (o no) superar el esfuerzo y el juicio de los seres humanos.

La labia asombrosa de ChatGPT y otros modelos lingüísticos de gran tamaño (LLM por la sigla en inglés) creó la ilusión de que la IA generativa era un avance revolucionario. ChatGPT alcanzó un millón de usuarios a los cinco días de su lanzamiento y 300 millones de usuarios semanales dos años después. Gigantes de la tecnología de avanzada como Microsoft, Meta y Alphabet apostaron cifras astronómicas a productos de IA y centros de datos, olvidándose enseguida de su entusiasmo anterior por la realidad virtual y aumentada.

En 2024, Nvidia, que había invertido dos mil millones de dólares en su chip de IA Blackwell, se convirtió en la empresa más valiosa del mundo, tras multiplicarse por nueve su capitalización bursátil en dos años. Su director ejecutivo, Jensen Huang, predijo que en los próximos años se invertiría un billón de dólares en centros de datos que usen chips de IA. De pronto, la prudente y paciente estrategia de Apple para la IA pareció anticuada.

A nadie importó que la nueva IA no ofreciera a los usuarios finales un valor ni remotamente comparable a la inversión monumental (por no mencionar su demanda insaciable de electricidad). Se siguieron sumando inversiones, dando por sentado que los centros de datos hiperescalados reducirían los costos de la IA y que con el uso creciente los modelos se volverían más inteligentes.

Secure your copy of PS Quarterly: The Year Ahead 2025
PS_YA25-Onsite_1333x1000

Secure your copy of PS Quarterly: The Year Ahead 2025

Our annual flagship magazine, PS Quarterly: The Year Ahead 2025, has arrived. To gain digital access to all of the magazine’s content, and receive your print copy, subscribe to PS Digital Plus now.

Subscribe Now

Pero tras su apariencia de novedad, los LLM generan resultados usando reconocimiento de patrones y predicciones estadísticas, igual que muchos de los modelos de IA tradicionales; es decir que su fiabilidad depende de que el futuro sea como el pasado. Es una limitación importante. Los seres humanos pueden reinterpretar los datos históricos usando la imaginación para prever lo que puede cambiar en el futuro; y mejorar sus predicciones interactuando con otros seres humanos mediante el discurso imaginativo. Nada de esto pueden hacer los algoritmos de IA.

Pero no es un defecto fatal. Como los procesos regidos por las leyes de la naturaleza son estables por naturaleza, el futuro tiene muchas semejanzas con el pasado. Los modelos de IA pueden hacerse más fiables con el entrenamiento, siempre que los datos de retroalimentación no sean ambiguos; e incluso si el proceso subyacente es inestable (o los datos ambiguos), las predicciones estadísticas pueden ser más rentables que el juicio humano. Aun cuando los algoritmos de Google o Meta presentan anuncios totalmente irrelevantes, son mejores que la publicidad indiscriminada. La conversión de voz a texto del teléfono móvil puede generar errores desastrosos, pero es más veloz y conveniente que teclear en una pantalla pequeña.

Al llegar 2022, innovadores ingeniosos habían descubierto muchísimos casos en los que la IA basada en la predicción estadística era lo bastante buena o incluso mejor que las alternativas dependientes del juicio humano. Conforme mejoraran el hardware y el software, era inevitable que aparecieran cada vez más casos de uso rentables. Pero pensar que los LLM eran un gran avance sólo porque podían conversar como los humanos fue una ilusión. En mi experiencia personal, los LLM me han resultado peor que inútiles como herramientas para investigar, elaborar resúmenes o generar gráficos.

Pero las noticias sobre las proezas de DeepSeek causaron conmoción en los mercados financieros. DeepSeek asegura que logró un desempeño de IA comparable a OpenAI y Google usando sólo chips Nvidia de gama baja, por una fracción de los costos de entrenamiento y operación. Si fuera cierto, no habrá tanta demanda de chips de IA de gama alta como se preveía. Por eso el anuncio de DeepSeek eliminó en un solo día unos 600 000 millones de dólares de la capitalización bursátil de Nvidia (y dio un duro golpe a las acciones de otras fabricantes de semiconductores y de compañías que han invertido en centros de datos o les venden electricidad).

Por supuesto, las afirmaciones de DeepSeek pueden resultar inexactas. Muchas de las afirmaciones de Tesla sobre sus inventos después de su gran avance con la CA fueron exageradas e incluso fraudulentas; y la maquinaria de propaganda soviética solía inventar avances científicos y tecnológicos a la par de los reales. Pero una innovación de bajo costo lista para usar puede resultar transformadora. Basta ver los cohetes baratos reutilizables de Musk. La exitosa misión de la India a Marte costó apenas 73 millones de dólares, menos que el presupuesto de la película de ciencia ficción Gravity de Hollywood.

Si resulta cierta, la tecnología de DeepSeek puede ser para los LLM lo que los inventos de Tesla en el área de la CA para la electrificación. Aunque no puede superar las limitaciones inevitables de los modelos estadísticos entrenados con datos pasados, tal vez los abarate lo bastante para difundir su uso. Los desarrolladores de LLM se independizarán de los subsidios de grandes operadores a los que les interesa tenerlos cautivos. Modelos menos ávidos de recursos pueden reducir la demanda de centros de datos o ayudar a reorientarlos hacia usos económicamente más justificables.

¿Y qué decir de la geopolítica? En mayo del año pasado, un informe del Grupo de Trabajo Bipartidario sobre IA del Senado de los Estados Unidos pidió 32 000 millones de dólares anuales de gasto «de emergencia» en IA (fuera del área de defensa), supuestamente para competir mejor con China. El capitalista de riesgo Marc Andreessen describió la llegada de DeepSeek como «el momento Sputnik de la IA». El presidente estadounidense Donald Trump considera que el modelo de IA chino es una «llamada de atención para las industrias estadounidenses», que deben «tener la mira puesta en competir para ganar». Ha anunciado planes para imponer nuevos aranceles a la importación de semiconductores desde China; y su predecesor había impuesto controles a la exportación de chips de IA de gama alta.

En mi libro The Venturesome Economy sostengo que es un error ver los avances transformadores en el extranjero como una amenaza para el bienestar local. Perseguir el liderazgo tecnológico o científico a como dé lugar es una empresa absurda. Lo más importante es la voluntad y la capacidad de las empresas y de los consumidores para desarrollar y usar productos y tecnologías derivados de la investigación de vanguardia, venga de donde venga. Esto también se aplica a los modelos de IA de código abierto de DeepSeek.

Por supuesto, hay que controlar el uso militar amenazante de tecnologías occidentales de vanguardia por parte de regímenes hostiles. Pero esto es un reto diferente y difícil. Si se pudiera resolver con controles a las exportaciones, hace tiempo que habríamos dejado de preocuparnos por las armas nucleares norcoreanas o iraníes.

Traducción: Esteban Flamini

https://prosyn.org/C46PAyXes