नई दिल्ली, 5 अप्रैल
जैसे-जैसे आर्टिफिशियल इंटेलिजेंस (एआई) के क्षेत्र में जंग बढ़ती जा रही है, एलन मस्क के स्वामित्व वाले ग्रोक और चीनी डीपसीक मॉडल अब एआई क्षमता के मामले में सबसे आगे हैं - एक पहुंच और दक्षता के लिए अनुकूलित है और दूसरा क्रूर-बल पैमाने के लिए - प्रशिक्षण संसाधनों में भारी असमानता के बावजूद, शनिवार को एक रिपोर्ट में दिखाया गया।
काउंटरपॉइंट रिसर्च के अनुसार, ग्रोक-3 समझौता किए बिना पैमाने का प्रतिनिधित्व करता है - 200,000 NVIDIA H100 फ्रंटियर लाभ का पीछा करते हैं, जबकि डीपसीक-आर1 कंप्यूट के एक अंश का उपयोग करके समान प्रदर्शन प्रदान करता है, जो संकेत देता है कि अभिनव वास्तुकला और क्यूरेशन क्रूर बल को टक्कर दे सकते हैं।
फरवरी से, डीपसीक ने दुनिया के फ्रंटियर रीजनिंग मॉडल के बराबर प्रदर्शन देने के लिए अपने प्रमुख रीजनिंग मॉडल डीपसीक-आर1 को ओपन-सोर्स करके वैश्विक सुर्खियाँ बटोरी हैं।
काउंटरपॉइंट में एआई के प्रमुख विश्लेषक वेई सन ने कहा, "इसकी खासियत सिर्फ़ इसकी बेहतरीन क्षमताएं ही नहीं हैं, बल्कि यह तथ्य भी है कि इसे सिर्फ़ 2,000 NVIDIA H800 GPU का उपयोग करके प्रशिक्षित किया गया था - H100 का एक छोटा, निर्यात-अनुरूप विकल्प, जो इसकी उपलब्धि को दक्षता में एक मास्टरक्लास बनाता है।" मस्क के xAI ने Grok-3 का अनावरण किया है, जो अब तक का उसका सबसे उन्नत मॉडल है, जो DeepSeek-R1, OpenAI के GPT-o1 और Google के Gemini 2 से थोड़ा बेहतर प्रदर्शन करता है। सन ने कहा, "DeepSeek-R1 के विपरीत, Grok-3 मालिकाना है और इसे xAI के सुपरकंप्यूटर Colossus पर 200,000 H100 GPU का उपयोग करके प्रशिक्षित किया गया था, जो कम्प्यूटेशनल पैमाने में एक बड़ी छलांग का प्रतिनिधित्व करता है।"