La empresa china DeepSeek lanza su esperado nuevo modelo de IA
La empresa emergente china DeepSeek presentó este viernes un nuevo modelo de inteligencia artificial (IA) con costos "drásticamente reducidos", más de un año después de sorprender al mundo con un "chatbot" barato que igualaba en capacidades a sus rivales estadounidenses.
La industria tecnológica mundial llevaba varias semanas a la espera de este anuncio, un barómetro de las ambiciones chinas en el sector.
A principios de 2025, la "startup" de Hangzhou logró cambiar las reglas del juego de la IA con R1, un modelo de "razonamiento" que, según defendió, rivalizaba a menor precio con Gemini, ChatGPT y Claude, gigantes norteamericanos que han recibido multimillonarios fondos para su desarrollo.
El nuevo DeepSeek-V4 presentado este viernes "cuenta con un contexto ultraextenso de un millón de palabras, lo que le permite alcanzar el liderazgo tanto en el ámbito nacional como en el de código abierto en cuanto a capacidades de los agentes, conocimiento del mundo y rendimiento en el razonamiento", afirmó la compañía en un comunicado.
Ya está disponible una "versión preliminar", añadió.
Los expertos afirman que el lanzamiento de V4, basado en un modelo de lenguaje extenso o LLM, marca un "punto de inflexión" en términos de hardware y costos.
"Esto aborda los problemas de larga data de un rendimiento más lento y precios más elevados asociados con longitudes de contexto extensas, lo que marca un verdadero punto de inflexión para la industria", consideró a la AFP Zhang Yi, fundador de la firma de investigación tecnológica iiMedia.
"Para los usuarios finales, esto traerá beneficios generalizados y accesibles. Por ejemplo, si el soporte de contexto ultralargo se convierte en una característica estándar, se espera que el procesamiento de textos extensos vaya más allá de los laboratorios de investigación de vanguardia y entre en las aplicaciones comerciales", dijo.
Este nuevo modelo de DeepSeek tiene dos versiones, DeepSeek-V4-Pro y DeepSeek-V4-Flash, esta última "una opción más eficiente y económica" debido a que tiene parámetros más reducidos.
- "Momento Sputnik" -
V4-Pro tiene 1,6 billones de parámetros, mientras que V4-Flash tiene 284.000 millones, lo que refina la capacidad de toma de decisiones de los modelos.
"En las pruebas de rendimiento de conocimiento del mundo, DeepSeek-V4-Pro supera significativamente a otros modelos de código abierto y solo es superado ligeramente por el modelo de código cerrado de primer nivel Gemini-Pro-3.1 (de Google)", añadió el comunicado.
La irrupción de esta empresa china el año pasado con el llamado "shock DeepSeek" desencadenó una venta masiva de acciones relacionadas con la IA, especialmente en Wall Street, y un replanteamiento de las estrategias empresariales.
Se describió también como un "momento Sputnik" para el sector, una expresión coloquial que alude al instante en que una industria o una sociedad toma conciencia, con inquietud, de haber quedado tecnológicamente rezagada frente a un competidor.
Ese chatbot de DeepSeek funcionó entonces a un nivel similar al de ChatGPT y otras herramientas de primer nivel, pero la empresa afirmó que su desarrollo había requerido una potencia de cálculo significativamente menor.
Sin embargo, su repentina popularidad suscitó dudas sobre la privacidad de los datos y la censura, ya que el "chatbot" a menudo se negaba a responder preguntas sobre temas delicados, como la represión de Tiananmen de 1989.
En el país asiático, las herramientas de IA de DeepSeek han sido ampliamente adoptadas por los municipios y las instituciones de salud chinas, así como por el sector financiero y otras empresas.
Esto se ha visto impulsado en parte por la decisión de DeepSeek de convertir sus sistemas en código abierto, haciendo público su funcionamiento interno, en contraste con los modelos patentados que venden OpenAI y otros rivales occidentales.
La Casa Blanca acusó recientemente a las empresas chinas de competir por "robar" tecnología estadounidense, antes de la cumbre prevista entre Donald Trump y Xi Jinping en Pekín el próximo mes.
En esta intensa competencia de la IA, la estadounidense OpenAI, creadora del popular ChatGPT, también presentó el jueves un nuevo modelo que pretende ser el más avanzado del mercado.
S.Llorente--HdM