☕️ #92 - Cómo DeepSeek ha pinchado la burbuja de la IA americana

En el episodio de hoy Vicente Herrera nos explica por qué la presentación de DeepSeek, la nueva IA china, ha hecho temblar a Occidente. También probamos DeepSeek y nos saltamos su medidas de seguridad.

¿Cómo ejecutar DeepSeek en tu ordenador?

Puedes usar LM Studio para ejecutar modelos de inteligencia artificial LLM (Large Language Model), similares a ChatGPT.

Una vez has descargado e instalado LM Studio, puedes acceder a su catálogo de modelos que ofrece varias versiones de DeepSeek R1, además de otros conocidos modelos como Llama.

¿Por qué hay varias versiones de DeepSeek?

Se ofrecen en distintas versiones de destilado, con distinto número de parámetros.

A más parámetros tiene el modelo, más completas son las respuestas, pero también necesita un hardware más potente. Sobre todo, los modelos de inteligencia artificial necesitan mucha VRAM (Memoria RAM de la tarjeta gráfica).

Por ejemplo, el modelo completo de DeepSeek tiene tantos parámetros que necesitas casi un centro de datos entero para ejecutarlo.

La manera de conseguir modelos más reducidos que puedas ejecutar en tu máquina local es realizar un destilado. Estos son otros modelos más reducidos (como Llama) que han sido entrenados con el modelo original. Como resultado, se comportan con un rendimiento “parecido” al original pero necesitando una fracción de los recursos.

Una vez descargas un modelo que sea adecuado para tu equipo ya puedes empezar a hablar con la inteligencia artificial en local. Si tienes un equipo medianamente potente observarás que la experiencia de uso es más fluida que ChatGPT, que introduce un retardo al conectarse con un servidor remoto.

Estos modelos locales también son muy útiles para proteger nuestra privacidad, ya que ninguno de los datos que introducimos sale de nuestro equipo.

La guerra de las IAs, todo un culebrón

Este 2025 hemos sido testigos de una historia de sorpresas, intriga política, y acusaciones cruzadas que ha puesto patas arriba el ecosistema de los asistentes basados en inteligencia artificial.

Hemos intentado resumir los puntos clave con alguna licencia artística. Esperamos que os sirva para entender cómo ha hecho DeepSeek, la IA china, para liarla tan parda.

Los inicios de la guerra

Al presentar ChatGPT-3, y mientras la gente alucinaba de lo que era capaz, Sam Altman (CEO de OpenAI) hizo una gran campaña remarcando lo peligrosas que podían ser las IAs.

¿Los objetivos?

Que cualquier IA demasiado poderosa fuera prohibida. Curiosamente, el límite de potencia que quería marcar era la de OpenAI. Vamos que querían que cualquier IA más poderosa de OpenAI fuera prohibida para que ellos tuvieran siempre el liderazgo.

En todo caso este mensaje asustaviejas caló y se presentó a la comunidad internacional un acuerdo de no proliferación de inteligencias artificiales.

Pero también había otro pensamiento opuesto. Estas nuevas IAs que se estaban presentando eran tan impresionantes, que era muy extendida la creencia de que quien liderase esta tecnología controlaría el mundo. Así pues las super potencias (Estados Unidos, China, o Rusia) no firmaron este acuerdo, y comenzaron a invertir grandes cantidades de dinero en desarrollar IAs más potentes.

Por aquél entonces daba la sensación de que en pocos años las inteligencias artificiales iban a superar a los humanos. Ahora sabemos que fuimos muy optimistas, estamos ante una carrera de fondo. La tecnología actual está tremendamente limitada, y estamos lejos de crear una máquina que piense y razone.

Los primeros años de la guerra

Lo que hemos vivido los últimos años ha sido una locura. Cada semana encontrabas multiples noticias en la prensa contando cómo alguien había logrado un avance en algún campo de inteligencia artificial. Coches que se conducen solos, simulaciones, reconstrucciones de entornos 3D a partir de fotos, generación de textos e imágenes. Cuando parecía que ya lo habíamos visto todo, aparecía algo que nos volvía a dejar la boca abierta.

Se estaba invirtiendo mucho dinero en inteligencia artificial, pero esas inversiones dependían de que hubiera avances tangibles.

Por un lado el mundo académico presentaba papers científicos hablando de optimizaciones de algoritmos y de posibles aplicaciones prácticas de la inteligencia artificial.

Por otro lado, la industria se afanaba en buscar métodos para comercializar esta nueva tecnología. Uno de los pioneros fue GitHub con Copilot, una IA que ayudaba a los desarrolladores a escribir código y de la que hemos hablado multiples veces en este podcast. Entonces Tesla nos prometía que nuestros coches se iban a conducir solos. Y la estrategia de Nvidia nos parecía rara, no entendíamos para qué queríamos inteligencia artificial en nuestros ordenadores.

Luego en 2022 ChatGPT nos dejó atónitos, era un asistente virtual que sabía solucionar cualquier problema y además se podía adaptar a cualquier programa. Con Meta, Google, Apple y Microsoft a la cabeza, todas las grandes empresas tecnológicas entraron a la carrera por desarrollar su propio asistente inteligente, y nos intentaron vender la moto de que si un programa no tenía inteligencia artificial es que estaba anticuado. El problema es que esta inteligencia artificial no tiene sentido en la mayoría de los casos y los usuarios hemos empezado a odiarlos.

Por mucho que intentaran destronarlo, ChatGPT permanecía impasible en el primer puesto. Y parecía que siempre iba a ser así.

La guerra sucia

En occidente celebrábamos nuestro liderazgo en el desarrollo de las inteligencias artificiales, y evitábamos mencionar que lo estábamos consiguiendo a costa de sabotear a nuestros socios.

Al fin y al cabo, Estados Unidos estaba librando una guerra comercial contra China. Una guerra basada en aranceles, desprestigio a marcas prometedoras como Huawei, y sobre todo restricciones para que China no pudiera acceder al hardware más puntero. Estas restricciones se centraban en las tarjetas gráficas que se usan para entrenar modelos de inteligencia artificial.

Y mientras en occidente nos sentíamos cómodos en nuestra posición de superioridad, en China se estaba cociendo algo muy interesante. Y es que no hay nada como una situación de desventaja para que se te agudice el ingenio.

Explota la bomba

El 21 de Enero de 2025, por sorpresa, el laboratorio Chino DeepSeek anuncia su familia de modelos de inteligencia artificial R1:

Cutting-edge Chinese “reasoning” model rivals OpenAI o1—and it’s free to download

Lo sorprendente de este modelo no es solo que parece estar a la altura de la tecnología de OpenAI, si no que puedes ejecutarlo en tu propio ordenador sin conectarte a un servidor.

Sin previo aviso, ocurre que:

Occidente ya no tiene el monopolio de la inteligencia artificial.
China les ha alcanzado con menos recursos.
El modelo de DeepSeek es código abierto, cualquiera puede descargárselo.
Además incluye un “nuevo truco”. DeepSeek proporciona la cadena de pensamiento que sigue la IA para ofrecer cada respuesta.
De repente las inteligencias artificiales que se ejecutan sobre un servidor, como ChatGPT, parecen haberse quedado obsoletas.

Y todo esto está pasando después de que el gobierno estadounidense anuncie una inversión de 500 millardos de dólares americanos en inteligencia artificial:

China’s DeepSeek bombshell rocks Trump’s $500B AI boondoggle

Por unos días las grandes tecnológicas entran en pánico. ¿Qué está pasando? ¿Cómo es esto posible? ¿Ha seguido occidente la estrategia equivocada y ahora se van a quedar atrás?

Sin dejarles tiempo para poderse recuperar, el gigante AliBaba anuncia un nuevo modelo “Qwen 2.5” que asegura supera a “DeepSeek-V3”.

Alibaba releases AI model it says surpasses DeepSeek

Los ceos de silicon valley tirándose por la ventana cual crac del 29 pero lol son casas de una planta y sólo se tuercen el tobillo y gimotean en el césped
— álvaro ortiz (@alvaroortiz.bsky.social) 2025-01-28T10:06:07.619Z

Desde luego, todo un golpe de efecto desde China.

No es oro todo lo que reluce

Pasado el shock inicial, empiezan a llegar las primeras impresiones de los usuarios de DeepSeek.

Parece ser que el modelo de esta inteligencia artificial no está muy pulido y es muy fácil saltarse sus medidas de seguridad. Además hace cosas raras como mezclar texto en chino dentro de respuestas en inglés.

Estos fallos son un balón de aire para las grandes tecnológicas estadounidenses. Están en un aprieto, sí, pero al menos DeepSeek no es tan bueno como parecía en un principio.

El misterio del hardware prohibido

Hay un detalle que no pasa desapercibido, DeepSeek asegura que usó chips H100 de Nvidia para entrenar su modelo.

Chinese AI Lab DeepSeek Has 50,000 NVIDIA H100 AI GPUs, Says AI CEO

Solo hay un problema, Estados Unidos prohibió la venta de estos chips a China por ser demasiado potentes.

¿De dónde los han sacado?

NVIDIA comienza la investigación, si tienen un fallo en la cadena de suministro, pueden sufrir graves consecuencias en Estados Unidos.

NVIDIA le pide explicaciones a Super Micro sobre como consiguió vender GPU H100 en China a pesar de las restricciones

Nadie quiere admitir lo que es un secreto a voces, las sanciones de Estados Unidos a China no son muy efectivas. Es relativamente fácil encontrar hardware prohibido en el mercado negro.

La investigación se cerró con la detención de tres personas que supuestamente introdujeron los chips de NVIDIA en China a través de Singapur, para vendérselos a DeepSeek:

Singapore charges three with fraud that media link to Nvidia chips

El triple salto mortal, OpenAI acusa a DeepSeek de copiar a ChatGPT

A principios de Febrero recibimos la información que terminó de destapar el misterio. ¿Cómo había conseguido DeepSeek acercarse tanto a ChatGPT con tan pocos medios?

Según OpenAI, DeepSeek habría accedido de forma masiva a ChatGPT para entrenar a su modelo. ¡Usaron una inteligencia artificial para entrenar a la suya!

Lo cual pone a OpenAI en una situación paradójica. Se quejan de que DeepSeek ha robado su propiedad intelectual, pero ellos mismos usaron material protegido por derechos de autor para entrenar a su inteligencia artificial. Práctica que debe ser bastante extendida, hace poco también se descubrió que Meta descargó con torrent 81TB de libros con copyright.

Por otro lado, usar una inteligencia artificial para entrenar a otra es bastante común. Recién entrenada, una inteligencia artificial no sabe qué respuesta esperamos de ella. Como resultado, ofrece respuestas incoherentes, es capaz de revelar información sensible como instrucciones para construir una bomba, o tener comportamientos peligrosos como inducir al suicidio.

Para educar a una inteligencia artificial se requiere un largo proceso en el que se le hacen preguntas y se evalúan sus respuestas. Y este proceso es demasiado costoso para ser realizado por humanos, así que se usan otras inteligencias artificiales.

¿Os está petando ya la cabeza? Por que yo ya no la siento desde hace un rato.

Si este proceso no se hace correctamente puedes llegar a crear mounstros. Es lo que pasó con una versión de GPT-2, en la que un fallo en el algoritmo creó la inteligencia artificial máximamente lasciva:

A río revuelto, ganancia de pescadores

Vamos a terminar este culebrón con un poco de humor. Y es que ante todo este caos, ha habido quién ha intentado sacar tajada de manera bastante torpe.

¿Que China presenta una nueva inteligencia artificial? Francia no puede ser menos y presenta otra. Eso sí, es tan lamentable que tienen que acabar apagándola a los pocos días:

Francia lanza su propia IA para competir con ChatGPT y termina apagándola tras convertirse en el hazmerreír de Internet.

Por otro lado, Elon Musk aprovechó el desconcierto para intentar comprar OpenAI (los creadores ChatGPT). Esto en realidad es otro culebrón, pero será contado en otro momento:

Neural: Elon Musk tries to buy OpenAI, Sam Altman declines but says they’ll take Twitter

A lo que Sam Altman, el CEO de OpenAI, se ofreció a comprar Twitter por 9 millardos de dólares en referencia al valor actual de la compañía. Recordemos que Twitter tenía una valoración de 40 millardos cuando la compró Elon Musk. ¡Su valoración se ha reducido a menos de la cuarta parte!

no thank you but we will buy twitter for $9.74 billion if you want
— Sam Altman (@sama) February 10, 2025

¿Quieres saber más?

Y este es el estado de las inteligencias artificiales a principios de Marzo de 2025. Está todo patas arriba, y algo nos dice que este culebrón no ha hecho más que empezar.

Si quieres seguir aprendiendo sobre DeepSeek R1, os recomendamos este episodios de xHubAI en el que también participó Vicente Herrera.

¿Cómo ejecutar DeepSeek en tu ordenador?#

La guerra de las IAs, todo un culebrón#

Los inicios de la guerra#

Los primeros años de la guerra#

La guerra sucia#

Explota la bomba#

No es oro todo lo que reluce#

El misterio del hardware prohibido#

El triple salto mortal, OpenAI acusa a DeepSeek de copiar a ChatGPT#

A río revuelto, ganancia de pescadores#

¿Quieres saber más?#