नई दिल्ली: जैसा कि आर्टिफिशियल इंटेलिजेंस (एआई) की दौड़ तेज होती है, एलोन मस्क के स्वामित्व वाली ग्रोक और चीन के डीपसेक मॉडल अगली-जीन एआई क्षमताओं में अग्रणी के रूप में उभरे हैं-एक प्राथमिकता वाले पहुंच और दक्षता, दूसरा ब्रूट-फोर्स स्केल की सीमाओं को आगे बढ़ाता है। यह विपरीत प्रशिक्षण संसाधनों में एक महत्वपूर्ण असमानता के बावजूद आता है, काउंटरपॉइंट रिसर्च की एक हालिया रिपोर्ट के अनुसार।
ग्रोक -3 अत्याधुनिक पैमाने को उदाहरण देता है, अत्याधुनिक प्रगति की खोज में 200,000 एनवीडिया एच 100 जीपीयू द्वारा संचालित। इसके विपरीत, डीपसेक-आर 1 कम्प्यूटेशनल संसाधनों के एक अंश का उपयोग करके तुलनीय प्रदर्शन को प्राप्त करता है, यह दर्शाता है कि आर्किटेक्चरल इनोवेशन और डेटा क्यूरेशन कैसे प्रभावी ढंग से सरासर प्रसंस्करण शक्ति को प्रतिद्वंद्वी कर सकता है।
फरवरी के बाद से, दीपसेक ने अपने प्रमुख तर्क मॉडल, डीपसेक-आर 1 को ओपन-सोर्सिंग करके वैश्विक ध्यान आकर्षित किया है, जिसने दुनिया के कुछ प्रमुख एआई सिस्टम के साथ सममूल्य पर प्रदर्शन का प्रदर्शन किया है।
“यह जो कुछ भी अलग करता है, वह सिर्फ अपनी कुलीन क्षमताओं के अलावा नहीं है, लेकिन यह तथ्य कि यह केवल 2,000 NVIDIA H800 GPU का उपयोग करके प्रशिक्षित किया गया था-H100 के लिए एक स्केल-डाउन, निर्यात-अनुपालन विकल्प, इसकी उपलब्धि को दक्षता में एक मास्टरक्लास बना दिया है,” वेई सन ने कहा, काउंटरपॉइंट में एआई में प्रिंसिपल एनालिस्ट ने कहा।
मस्क के XAI ने GROK-3 का अनावरण किया है, जो आज तक का सबसे उन्नत मॉडल है, जो कि डीपसेक-आर 1, ओपनईआई के जीपीटी-ओ 1 और Google के मिथुन 2 से थोड़ा बेहतर प्रदर्शन करता है। “डीपसेक-आर 1 के विपरीत, ग्रोक -3 प्रोप्रायटरी है और एक चौंका देने वाला 200,000 एच 100 जीपीयूएंट्स,
GROK-3 ब्रूट-फोर्स रणनीति का प्रतीक है-बड़े पैमाने पर गणना पैमाने (GPU लागत में अरबों डॉलर का प्रतिनिधित्व) ड्राइविंग वृद्धिशील प्रदर्शन लाभ। यह एक मार्ग है जो केवल सबसे धनी तकनीकी दिग्गज या सरकारें वास्तविक रूप से पीछा कर सकती हैं।
“इसके विपरीत, डीपसेक-आर 1 मिश्रण के एक अंश के साथ तुलनीय परिणाम प्राप्त करने के लिए, क्यूरेटेड और उच्च गुणवत्ता वाले डेटा के साथ मिलकर, मिक्सचर-ऑफ-एक्सपर्ट्स (एमओई) और रीइन्फोर्समेंट लर्निंग जैसी तकनीकों का लाभ उठाकर एल्गोरिथम सरलता की शक्ति को प्रदर्शित करता है।”
GROK-3 साबित करता है कि 100x अधिक GPU फेंकना सीमांत प्रदर्शन लाभ तेजी से प्राप्त कर सकता है। लेकिन यह निवेश (आरओआई) पर तेजी से कम होने वाले रिटर्न को भी उजागर करता है, क्योंकि अधिकांश वास्तविक दुनिया के उपयोगकर्ता वृद्धिशील सुधारों से न्यूनतम लाभ देखते हैं। संक्षेप में, डीपसेक-आर 1 न्यूनतम हार्डवेयर ओवरहेड के साथ कुलीन प्रदर्शन को प्राप्त करने के बारे में है, जबकि GROK-3 किसी भी कम्प्यूटेशनल साधन द्वारा सीमाओं को आगे बढ़ाने के बारे में है, रिपोर्ट में कहा गया है। (आईएएनएस इनपुट के साथ)