Janet Nguyen, marketplace
La startup china DeepSeek desconcertó a los inversores tecnológicos poco después del lanzamiento de un modelo de inteligencia artificial y un chatbot que rivaliza con los productos de OpenAI.
Su asistente chatbot llegó a la cima de la tienda de aplicaciones de Apple la semana pasada, superando a ChatGPT en un momento.
DeepSeek afirma que sus costos de entrenamiento solo totalizaron alrededor de $5,6 millones , mientras que OpenAI dijo en 2023 que costó más de $100 millones entrenar uno de sus modelos.
DeepSeek afirmó que pudo desarrollar sus modelos con menos chips de Nvidia, el principal proveedor de chips de IA y uno de los que mejor desempeño tiene en el mercado de valores. Como resultado, las acciones relacionadas con la IA cayeron, lo que provocó que los principales índices bursátiles cayeran a principios de la semana pasada, mientras que Nvidia perdió $600 mil millones en capitalización de mercado . A fines de enero, las acciones de Nvidia cayeron un 11%.
A pesar de la promesa de la empresa, la llegada de DeepSeek ha sido recibida con polémica. OpenAI afirma que DeepSeek utilizó sus modelos patentados al desarrollar su producto. Australia y Taiwán han prohibido a los empleados del gobierno utilizar cualquier producto y servicio de DeepSeek debido a problemas de seguridad, mientras que Italia eliminó los productos de DeepSeek de las tiendas de Apple y Google.
Suscríbete al boletín Marketplace para recibir las historias de negocios más importantes del día, nuestro análisis económico y explicaciones para ayudarte a vivir de manera más inteligente, directamente en tu bandeja de entrada todas las noches de los días de la semana.
En Estados Unidos, Texas también ha prohibido a los empleados del gobierno utilizar DeepSeek, mientras que la Marina estadounidense y el Pentágono habrían prohibido a sus miembros y personal acceder a la tecnología. El senador republicano Josh Hawley ha presentado un proyecto de ley que prohibiría a todos los estadounidenses importar cualquier tecnología de inteligencia artificial de China.
¿Qué es DeepSeek-R1?
DeepSeek-R1 es el nombre del modelo de lenguaje de código abierto de la empresa, que es un modelo de razonamiento. Este tipo de modelo se asemeja más a la forma en que piensan los humanos en comparación con las primeras iteraciones de ChatGPT, dijo Dominic Sellitto, profesor clínico adjunto de ciencias y sistemas de gestión en la Facultad de Gestión de la Universidad de Buffalo.
Para entender cómo funciona esto en la práctica, considere el “problema de la fresa”. Si le preguntara a un modelo de lenguaje cuántas “r” hay en la palabra fresa, las primeras versiones de ChatGPT tendrían dificultades para responder esa pregunta y podrían decir que solo hay dos “r”. Una teoría para esto es que técnicamente solo hay dos sonidos de “r” en la palabra, dijo Sellitto.
Pero los modelos de razonamiento mirarán cada letra, determinarán si es una “r” y luego contarán cuántas “r” hay en total, explicó.
OpenAI también ha desarrollado sus propios modelos de razonamiento y recientemente lanzó uno gratuito por primera vez.
Si bien el chatbot de DeepSeek ofrece las mismas capacidades que ChatGPT, censurará las preguntas que se consideren políticamente controvertidas en China, dijo S. Shyam Sundar, director del Centro de Inteligencia Artificial Socialmente Responsable de Penn State.
Por ejemplo, se negará a responder preguntas sobre las protestas de la Plaza Tiananmen en 1989, cuando el ejército chino mató a manifestantes.
¿DeepSeek plantea riesgos de seguridad?
DeepSeek afirma que la información personal que recopila de usted se almacena en servidores ubicados en China, de acuerdo con la política de privacidad de la empresa.
Recopila cualquier información que usted proporciona voluntariamente cuando se registra en sus servicios, como su dirección de correo electrónico; información relacionada con Internet o la red sobre usted, como su dirección IP; e información de terceros, como anunciantes.
Para aquellos que son expertos en tecnología, Sellitto dijo que tienen la opción de descargar el modelo de DeepSeek y ejecutarlo en su propio hardware, desconectado de la empresa.
Pero muchos usuarios ocasionales están utilizando el chatbot de la empresa. Hay que tener cuidado con los datos que se proporcionan a cualquier organización, no solo a DeepSeek, afirmó Sundar.
“Corres el riesgo de exponer parte de tu información personal si le pides, ya sabes, consejos sobre cómo manejar tus problemas de salud mental”, dijo Sundar.
Los sitios en general comparten su información con otros sitios y servicios, lo que puede facilitar que los delincuentes cibernéticos lo estafen, señaló Sundar.
Por qué DeepSeek está revolucionando la industria tecnológica
Las empresas de IA gastan mucho dinero en potencia informática para entrenar modelos de IA, lo que requiere unidades de procesamiento gráfico de empresas como Nvidia, dijo Sellitto.
Pero si no necesita tanta potencia computacional, como afirma DeepSeek, eso podría reducir su dependencia de los chips de la empresa, de ahí la caída del precio de las acciones de Nivdia.
Sin embargo, DeepSeek puede depender más de las GPU de lo que los inversores tecnológicos pensaron inicialmente. Si bien DeepSeek afirma que solo gastó 5,6 millones de dólares en capacitación, la firma de investigación SemiAnalysis dice que la compañía gastó 1.600 millones de dólares en costos de hardware.
DeepSeek dice que solo se necesitaron 2.000 GPU para entrenar su modelo de IA, pero SemiAnalysis dice que la compañía todavía tiene un inventario de 50.000 GPU Nvidia Hopper , que es un tipo de GPU utilizada para centros de datos.
Las personas también pueden descargar los modelos de DeepSeek sin pagar una tarifa de licencia, lo que Sellitto cree que animará a más organizaciones a crear herramientas de IA. Y si más personas utilizan el modelo de código abierto de DeepSeek, seguirán necesitando algunas GPU para entrenar esas herramientas, lo que ayudaría a mantener la demanda, incluso si las principales empresas tecnológicas no necesitan tantas GPU como podrían haber pensado.