La Pesadilla de OpenAI: Cómo DeepSeek R1 está Irrumpiendo en el Sector de la IA
Aquí va una breve descripción. El dominio de OpenAI en el sector de la IA está siendo desafiado por una nueva startup llamada DeepSeek, que ha creado un nuevo modelo de pesos abiertos llamado R1 que supuestamente supera a los mejores modelos de OpenAI en la mayoría de las métricas.
Introducción a DeepSeek R1
Esta es la leyenda de la imagen 1, La pesadilla de OpenAI
DeepSeek R1, una nueva startup de IA dirigida por un fondo de cobertura chino, ha creado un nuevo modelo de pesos abiertos llamado R1 que, según se dice, supera a los mejores modelos de OpenAI en la mayoría de las métricas. Esto ha provocado una onda expansiva en el sector de la IA, y muchos se preguntan cómo una startup relativamente pequeña ha podido conseguir resultados tan impresionantes.
¿Qué puede hacer realmente una Pi 5?
Esta es la leyenda de la imagen 2, Capacidades de Pi 5
La Pi 5, un ordenador pequeño y relativamente barato, puede ejecutar el modelo DeepSeek R1, pero sólo con algunas limitaciones. El modelo puede destilar otros modelos para que funcionen mejor en hardware más lento, lo que significa que una Raspberry Pi puede ejecutar uno de los mejores modelos locales de quen AI.
Superando a OpenAI con el 1% de los Recursos
Esta es la leyenda de la imagen 3, DeepSeek R1 671b
El modelo de DeepSeek puede superar a los mejores modelos de OpenAI en la mayoría de las métricas, y lo hizo por 6 millones de dólares, con GPUs que funcionan a la mitad del ancho de banda de la memoria de OpenAI. Este es un logro significativo, ya que todo el modelo de negocio de OpenAI se basa en que la gente no tenga acceso a la energía y los recursos de GPU demenciales para entrenar y ejecutar modelos masivos de IA.
Ejecutando DeepSeek R1 en una Raspberry Pi
Esta es la leyenda de la imagen 4, Raspberry Pi
Aunque la Raspberry Pi puede ejecutar técnicamente DeepSeek R1, no es lo mismo que DeepSeek R1 671b, que es un modelo de 400 GB que requiere una enorme cantidad de computación de GPU. Sin embargo, el modelo 14b más pequeño puede ejecutarse en una Raspberry Pi, aunque lentamente, a unos 1,2 tokens por segundo.
Acelerando DeepSeek R1 con una Tarjeta Gráfica Externa
Esta es la leyenda de la imagen 5, Tarjeta Gráfica Externa
Para acelerar DeepSeek R1, se puede utilizar una tarjeta gráfica externa, que puede proporcionar un aumento significativo del rendimiento. Con una tarjeta gráfica AMD W7700, el modelo puede ejecutarse a unos 20-50 tokens por segundo, dependiendo del tipo de trabajo que se esté realizando.
Ejecutando DeepSeek R1 en un Servidor
Esta es la leyenda de la imagen 6, Servidor
DeepSeek R1 también puede ejecutarse en un servidor, lo que puede proporcionar un rendimiento aún más impresionante. Con un servidor de 192 núcleos, el modelo puede ejecutarse a unos 4 tokens por segundo, lo que supone una mejora significativa con respecto a la Raspberry Pi.
GPUs en Raspberry Pi y Otras Placas Arm
Esta es la leyenda de la imagen 7, GPUs en Raspberry Pi
También hay opciones para ejecutar GPUs en Raspberry Pi y otras placas Arm, lo que puede proporcionar un aumento significativo del rendimiento. Con las GPUs AMD funcionando muy bien, y los drivers de código abierto de Intel también funcionando, hay muchas opciones disponibles para aquellos que buscan ejecutar modelos de IA en dispositivos basados en Arm.
Conclusión
La IA sigue estando en una burbuja masiva, con Nvidia perdiendo más de medio billón de dólares en valor en un día después de que se lanzara DeepSeek. Sin embargo, esto no significa que la IA no sea una tecnología significativa, y hay muchas aplicaciones potenciales para modelos de IA como DeepSeek R1. A medida que la tecnología continúa evolucionando, será interesante ver cómo se utiliza y qué aplicaciones potenciales puede tener.