.
La repentina fama de la Inteligencia Artificial DeepSeek pone a prueba sus sistemas
TECNOLOGÍA

La repentina fama de la Inteligencia Artificial DeepSeek pone a prueba sus sistemas

lunes, 27 de enero de 2025

La repentina fama de la Inteligencia Artificial DeepSeek pone a prueba sus sistemas

Foto: Bloomberg

Ingenieros habían comenzado a comparar el rendimiento de programación de DeepSeek con los modelos líderes como OpenAI

Bloomberg

Desde hace días se viene hablando de una empresa emergente de inteligencia artificial de origen chino que se opondría a ChatGPT.

En el Foro Económico Mundial de Davos la semana pasada, algunos mencionaron a DeepSeek, con sede en Hangzhou, y su modelo R1 recientemente lanzado como una de las principales razones para que países como Estados Unidos estén redoblando sus esfuerzos en materia de IA. En los foros de debate sobre tecnología, los ingenieros habían comenzado a comparar su rendimiento de programación con los modelos líderes de empresas como OpenAI y Microsoft. Su producto ascendió silenciosamente en las clasificaciones de los mejores en una tabla de clasificación de IA afiliada a la UC Berkeley.

Luego, en las últimas 36 horas, el interés por la startup se disparó. Los pesos pesados ​​de Silicon Valley, entre ellos el inversor Marc Andreessen y el padrino de la inteligencia artificial y científico jefe de Meta Platforms, Yann LeCun, comenzaron a sumarse a la conversación, y Andreessen calificó el modelo de DeepSeek como "uno de los avances más asombrosos e impresionantes" que haya visto jamás.

Al final del fin de semana, el asistente de inteligencia artificial de DeepSeek se había disparado a la cima de las listas de descargas de iPhone de Apple Inc. y se encontraba entre las principales descargas en la Play Store de Google, lo que presionó tanto los sistemas de la startup que el servicio dejó de funcionar durante más de una hora. La empresa finalmente se vio obligada a limitar las inscripciones a aquellos con números de teléfono de China continental, pero afirmó que la medida fue el resultado de "ataques maliciosos a gran escala" a sus servicios.

Las consecuencias del aparente aumento repentino del interés en torno a DeepSeek fueron rápidas y severas: el modelo de inteligencia artificial de la compañía, que afirma haber desarrollado a una fracción del costo de sus rivales sin sacrificar significativamente el rendimiento, provocó una caída de casi un billón de dólares en las acciones tecnológicas estadounidenses y europeas, ya que los inversores cuestionaron los planes de gasto de algunas de las empresas más grandes de Estados Unidos. La caída de las acciones del fabricante de chips de inteligencia artificial Nvidia Corp. por sí sola eliminó un récord de 589 mil millones de dólares en valor bursátil de la empresa más grande del mundo el lunes.

Algunas acciones, incluida Nvidia, posteriormente borraron algunas pérdidas en operaciones posteriores al cierre.

El lunes, quedó claro que el interés abrumador en los servicios de DeepSeek estaba afectando al sistema de la empresa. “Actualmente, solo se admite el registro con un número de teléfono móvil de China continental”, dijo la startup en su página de estado . DeepSeek no especificó si las restricciones al registro son temporales o cuánto durarán.

Se trata de la interrupción más prolongada de la empresa desde que comenzó a informar sobre su estado. A diferencia de algunos rivales, el asistente de DeepSeek muestra su funcionamiento y razonamiento a medida que responde a una consulta o solicitud escrita del usuario. Las reseñas en la tienda de aplicaciones de Apple y en la Play Store de Android de Alphabet Inc. elogiaron esa transparencia.

Fundado por el jefe de fondos cuantitativos Liang Wenfeng, el modelo de inteligencia artificial de código abierto de DeepSeek está impulsando un replanteamiento de los miles de millones de dólares que las empresas han estado gastando para mantenerse a la vanguardia en la carrera de la inteligencia artificial.

“Si bien aún queda por ver si DeepSeek demostrará ser una alternativa viable y más barata a largo plazo, las preocupaciones iniciales se centran en si el poder de fijación de precios de los gigantes tecnológicos estadounidenses está siendo amenazado y si su enorme gasto en IA necesita una reevaluación”, dijo Jun Rong Yeap de IG Asia.

Al igual que todos los demás modelos de inteligencia artificial fabricados en China, DeepSeek se autocensura en temas considerados políticamente sensibles en China. A diferencia de ChatGPT, DeepSeek desvía las preguntas sobre la Plaza de Tiananmen, el presidente Xi Jinping o la posibilidad de que China invada Taiwán. Esto puede resultar chocante para los usuarios internacionales, que tal vez no hayan tenido contacto directo con los chatbots chinos antes.

El éxito inicial ofrece un contrapunto a las expectativas de que la IA más avanzada requerirá cantidades cada vez mayores de potencia computacional y energía, una suposición que ha llevado las acciones de Nvidia y sus proveedores a máximos históricos.

El costo exacto de desarrollo y el consumo de energía de DeepSeek no están completamente documentados, pero la startup ha presentado cifras que sugieren que su costo fue solo una fracción de los últimos modelos de OpenAI. El hecho de que un modelo de IA pequeño y eficiente surgiera de China, que ha sido objeto de crecientes sanciones comerciales de Estados Unidos sobre los chips avanzados de Nvidia, también pone en tela de juicio la eficacia de tales medidas.

“Estados Unidos es excelente en investigación e innovación, y especialmente en innovación de vanguardia, pero China es mejor en ingeniería”, dijo el informático Kai-Fu Lee a principios de este mes en el Foro Financiero Asiático en Hong Kong. “En esta época, cuando se tiene un poder de cómputo y un dinero limitados, se aprende a construir cosas de manera muy eficiente”.

Por su parte, Nvidia, el mayor proveedor de chips utilizados para entrenar software de IA, describió el nuevo modelo de DeepSeek como un “excelente avance en IA” que cumple plenamente con las restricciones del gobierno estadounidense a las exportaciones de tecnología. El trabajo de la startup “ilustra cómo se pueden crear nuevos modelos” utilizando una técnica conocida como escala de tiempo de prueba, afirmó la empresa.

La declaración de Nvidia pareció desmentir las sospechas de algunos analistas y expertos de que la startup china no podría haber logrado el avance que afirma. La empresa también señaló que la inferencia, el trabajo de ejecutar modelos de IA y usarlos para procesar datos y hacer predicciones, requiere de todos modos muchos de sus productos.

“La inferencia requiere una cantidad significativa de GPU Nvidia y redes de alto rendimiento”, afirmó la compañía.

Conozca los beneficios exclusivos para
nuestros suscriptores

ACCEDA YA SUSCRÍBASE YA

MÁS DE GLOBOECONOMÍA

México 14/02/2025

Bajo ritmo de la economía y consolidación fiscal, entre retos que señala UBS en México

Ven posible que el país resolverá eventualmente estos retos, pues de ello depende mantener la estabilidad económica y la confianza de los inversionistas

Energía 14/02/2025

Colombia, sexto país con la gasolina más cara de América Latina y el 126 a nivel mundial

Los países del mundo con la gasolina más costosa son: Hong Kong (US$12,8), Islandia (US$8,43) y, por último, Dinamarca (US$8,02)

Moda 14/02/2025

La marca Hermès supera US$314.000 millones en valor de mercado y se acerca a Lvmh

Las acciones de Hermès International SCA alcanzaron un récord después de publicar resultados superiores a las previsiones en el cuarto trimestre