OpenAI का बुरा सपना: कैसे DeepSeek R1 AI सेक्टर को बाधित कर रहा है
यहाँ कुछ छोटा विवरण दिया गया है। AI सेक्टर में OpenAI के प्रभुत्व को DeepSeek नामक एक नए स्टार्टअप द्वारा चुनौती दी जा रही है, जिसने R1 नामक एक नया ओपन वेट मॉडल बनाया है जो कथित तौर पर अधिकांश मेट्रिक्स में OpenAI के सर्वश्रेष्ठ मॉडलों को मात देता है।
DeepSeek R1 का परिचय
यह इमेज 1 का कैप्शन है, OpenAI का बुरा सपना
DeepSeek R1, एक चीनी हेज फंड द्वारा चलाया जाने वाला एक नया AI स्टार्टअप है, जिसने R1 नामक एक नया ओपन वेट मॉडल बनाया है जो कथित तौर पर अधिकांश मेट्रिक्स में OpenAI के सर्वश्रेष्ठ मॉडलों को मात देता है। इसने AI सेक्टर में झटके भेज दिए हैं, और कई लोग सोच रहे हैं कि अपेक्षाकृत छोटा स्टार्टअप इतने प्रभावशाली परिणाम कैसे प्राप्त कर सकता है।
Pi 5 वास्तव में क्या कर सकता है?
यह इमेज 2 का कैप्शन है, Pi 5 क्षमताएं
Pi 5, एक छोटा और अपेक्षाकृत सस्ता कंप्यूटर, DeepSeek R1 मॉडल चला सकता है, लेकिन केवल कुछ सीमाओं के साथ। मॉडल अन्य मॉडलों को डिस्टिल कर सकता है ताकि वे धीमे हार्डवेयर पर बेहतर तरीके से चल सकें, जिसका अर्थ है कि एक Raspberry Pi सर्वश्रेष्ठ लोकल क्वेन AI मॉडल में से एक चला सकता है।
1% संसाधनों के साथ OpenAI को हराना
यह इमेज 3 का कैप्शन है, DeepSeek R1 671b
DeepSeek का मॉडल अधिकांश मेट्रिक्स में OpenAI के सर्वश्रेष्ठ मॉडलों को मात दे सकता है, और इसने इसे 6 मिलियन डॉलर में किया, जिसमें GPUs थे जो OpenAI की मेमोरी बैंडविड्थ से आधी पर चलते हैं। यह एक महत्वपूर्ण उपलब्धि है, क्योंकि OpenAI का संपूर्ण बिजनेस मॉडल इस बात पर आधारित है कि लोगों के पास बड़े AI मॉडल को प्रशिक्षित करने और चलाने के लिए पागल ऊर्जा और GPU संसाधन नहीं हैं।
Raspberry Pi पर DeepSeek R1 चलाना
यह इमेज 4 का कैप्शन है, Raspberry Pi
जबकि Raspberry Pi तकनीकी रूप से DeepSeek R1 चला सकता है, यह DeepSeek R1 671b जैसा नहीं है, जो एक 400 GB मॉडल है जिसके लिए भारी मात्रा में GPU कंप्यूट की आवश्यकता होती है। हालाँकि, छोटा 14b मॉडल Raspberry Pi पर चल सकता है, हालाँकि धीरे-धीरे, लगभग 1.2 टोकन प्रति सेकंड पर।
एक बाहरी ग्राफिक्स कार्ड के साथ DeepSeek R1 को गति देना
यह इमेज 5 का कैप्शन है, बाहरी ग्राफिक्स कार्ड
DeepSeek R1 को गति देने के लिए, एक बाहरी ग्राफिक्स कार्ड का उपयोग किया जा सकता है, जो प्रदर्शन में एक महत्वपूर्ण बढ़ावा प्रदान कर सकता है। AMD W7700 ग्राफिक्स कार्ड के साथ, मॉडल लगभग 20-50 टोकन प्रति सेकंड पर चल सकता है, जो कि किए जा रहे कार्य के प्रकार पर निर्भर करता है।
एक सर्वर पर DeepSeek R1 चलाना
यह इमेज 6 का कैप्शन है, सर्वर
DeepSeek R1 को एक सर्वर पर भी चलाया जा सकता है, जो और भी प्रभावशाली प्रदर्शन प्रदान कर सकता है। 192-कोर सर्वर के साथ, मॉडल लगभग 4 टोकन प्रति सेकंड पर चल सकता है, जो कि Raspberry Pi की तुलना में एक महत्वपूर्ण सुधार है।
Raspberry Pi और अन्य आर्म बोर्ड पर GPUs
यह इमेज 7 का कैप्शन है, Raspberry Pi पर GPUs
Raspberry Pi और अन्य Arm बोर्ड पर GPUs चलाने के विकल्प भी हैं, जो प्रदर्शन में एक महत्वपूर्ण बढ़ावा प्रदान कर सकते हैं। AMD GPUs के शानदार ढंग से काम करने और Intel ओपन-सोर्स ड्राइवरों के भी काम करने के साथ, AI मॉडल को आर्म आधारित डिवाइस पर चलाने के इच्छुक लोगों के लिए कई विकल्प उपलब्ध हैं।
निष्कर्ष
AI अभी भी एक बड़े बुलबुले में है, DeepSeek के लॉन्च होने के बाद Nvidia ने एक दिन में आधे ट्रिलियन डॉलर से अधिक का मूल्य खो दिया। हालाँकि, इसका मतलब यह नहीं है कि AI एक महत्वपूर्ण तकनीक नहीं है, और DeepSeek R1 जैसे AI मॉडल के लिए कई संभावित अनुप्रयोग हैं। जैसे-जैसे तकनीक का विकास जारी है, यह देखना दिलचस्प होगा कि इसका उपयोग कैसे किया जाता है और इसके क्या संभावित अनुप्रयोग हो सकते हैं।