Google का नवीनतम डिफ्यूज़नजेम्मा ओपन AI मॉडल 4x स्पीड बूस्ट के साथ आता है

0
3
डिफ्यूज़नजेम्मा


एक और दिन, Google का एक और AI मॉडल। इस बार, Google DeepMind ने एक नया सदस्य जारी किया है जेम्मा 4 खुला मॉडल परिवारलेकिन यह बाकी लाइनअप से मौलिक रूप से अलग है। डिफ्यूजनजेम्मा अधिकांश एआई मॉडल की तरह रैखिक रूप से आउटपुट उत्पन्न नहीं करता है। इसके बजाय, यह समानांतर में पाठ का एक पूरा ब्लॉक तैयार कर सकता है। गूगल कहता है एनवीडिया डीजीएक्स या साधारण गेमिंग जीपीयू जैसे स्थानीय हार्डवेयर पर चलने पर यह इसे तेज़ और अधिक कुशल बनाता है।

अधिकांश एआई मॉडल को ऑटोरेग्रेसिव होने के लिए डिज़ाइन किया गया है – वे एक समय में बाएं से दाएं एक टोकन पर टेक्स्ट उत्पन्न करते हैं। डिफ्यूजनजेम्मा में से शुरू होती हैं और फिर वांछित सामग्री बनाने के लिए इसे निरूपित करती हैं। यह मॉडल संभावित टोकन उत्पन्न करने और दूसरों के अनुमान को बेहतर बनाने के लिए उनका उपयोग करने के लिए कैनवास पर कई बार चलने वाले प्लेसहोल्डर टोकन का एक क्षेत्र लेता है। प्रक्रिया के अंत में, मॉडल अपने टोकन आउटपुट को एक बड़े ब्लॉक – “डिनोइज्ड” टेक्स्ट कैनवास में अंतिम रूप देता है।

🛍️
Best Trending Products Deals
Compare prices & buy online
Buy Now →

Google के ओपन मॉडल के दायरे में डिफ्यूजनजेम्मा काफी बड़ा है। यह विशेषज्ञों का मिश्रण (एमओई) मॉडल है जिसमें कुल 26 बिलियन पैरामीटर हैं, लेकिन अनुमान के दौरान केवल 3.8 बिलियन ही सक्रिय होते हैं। इसका मतलब है कि इसे हाई-एंड जीपीयू के 18 जीबी रैम आवंटन में फिट होना चाहिए। आरटीएक्स 5090 के साथ परीक्षण में, डिफ्यूजनजेम्मा प्रति सेकंड लगभग 700 टोकन उगलता है। एकल एनवीडिया एच100 एआई एक्सेलेरेटर के साथ, डिफ्यूजनजेम्मा प्रति सेकंड 1,000+ टोकन का उत्पादन कर सकता है। यह समान आकार के ऑटोरेग्रेसिव जेम्मा मॉडल के आउटपुट का लगभग चार गुना है।

पाठ निर्माण के लिए यह दृष्टिकोण मेमोरी बैंडविड्थ से लेकर गणना तक की बाधा को स्थानांतरित करता है, जिससे समानांतर में 256 टोकन उत्पन्न होते हैं। Google का कहना है कि यह इन-लाइन संपादन, आणविक अनुक्रमण और गणितीय रेखांकन जैसे गैर-रेखीय कार्यों में मापनीय वृद्धि प्रदान करता है। उपरोक्त एनीमेशन से पता चलता है कि सुडोकू पहेलियों को हल करने के लिए डिफ्यूजनजेम्मा को कैसे ट्यून किया गया था, जो मानक ऑटोरेग्रेसिव एआई मॉडल के लिए एक बेहद चुनौतीपूर्ण कार्य है क्योंकि प्रत्येक टोकन भविष्य के टोकन पर निर्भर करता है। डिफ्यूजनजेम्मा की टोकन के बड़े सेटों को लगातार स्वयं-सही करने की क्षमता इसे आसान बनाती है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here