टेक महिंद्रा ने NVIDIA के साथ मिलकर हिंदी-फर्स्ट एजुकेशन LLM लॉन्च किया

टेक्नोलॉजी कंसल्टिंग और डिजिटल सॉल्यूशन की ग्लोबल प्रोवाइडर टेक महिंद्रा ने अपने प्रोजेक्ट इंडस इनिशिएटिव के तहत एक नया एजुकेशन-फोकस्ड लार्ज लैंग्वेज मॉडल (LLM) लॉन्च करने के लिए NVIDIA के साथ पार्टनरशिप की है। टेक महिंद्रा ने कन्फर्म किया कि हिंदी-फर्स्ट मॉडल को सॉवरेन और स्केलेबल आर्टिफिशियल इंटेलिजेंस देने के लिए ऑथेंटिक इंडियन लिंग्विस्टिक और कल्चरल कॉन्टेक्स्ट के साथ बनाया गया है।

एक एजुकेशनल मॉडल के तौर पर शुरू हो रहे नए LLM का मकसद पूरे देश में हाई-क्वालिटी लर्निंग को डेमोक्रेटाइज करना है। इसे लाखों स्टूडेंट्स को फिजिक्स और दूसरे सब्जेक्ट्स की गहरी बेसिक समझ हासिल करने में मदद करने के लिए डिज़ाइन किया गया है, साथ ही भारत की लिंग्विस्टिक और कल्चरल डायवर्सिटी को भी अपनाया जा सके। कई पार्टनर्स के सपोर्ट से, यह प्लेटफॉर्म एजुकेशनल यूज़ केस के लिए एक कॉम्प्रिहेंसिव रिसोर्स के तौर पर काम करने के लिए है।

NVIDIA के एंटरप्राइज सॉफ्टवेयर के वाइस प्रेसिडेंट, जॉन फैनेली ने कहा, “सॉवरेन AI के लिए ग्लोबल पुश लोकल भाषाओं और कल्चरल कॉन्टेक्स्ट के हिसाब से फाउंडेशन मॉडल की डिमांड बढ़ा रहा है। NVIDIA AI एंटरप्राइज का फायदा उठाकर, टेक महिंद्रा प्रोजेक्ट इंडस को पावर देने के लिए ज़रूरी प्रोडक्शन-रेडी परफॉर्मेंस, रिलायबिलिटी और स्केल देता है।”

एजुकेशन LLM के डेवलपमेंट में NVIDIA के एडवांस्ड AI फ्रेमवर्क और इंफ्रास्ट्रक्चर का इस्तेमाल किया गया, जिसमें NVIDIA NeMo फ्रेमवर्क और NVIDIA NIM माइक्रोसर्विस के ज़रिए डिप्लॉयमेंट शामिल है। इन टूल्स ने मॉडल को प्रोडक्शन रेडीनेस और स्केलेबिलिटी हासिल करने में मदद की।

खास भाषाओं में डेटा की कमी को मैनेज करने के लिए, टेक महिंद्रा टीम ने NVIDIA NeMo डेटा डिज़ाइनर के साथ आधे बिलियन सिंथेटिक टोकन बनाने के लिए नई तकनीकों का इस्तेमाल किया। यह मॉडल एजेंटिक AI को भी सपोर्ट करता है, जिससे ऐसे ऑटोनॉमस एजेंट बनाए जा सकते हैं जो AI-ड्रिवन लर्निंग को आसान बनाने के लिए “नेचुरल हिंदी” में आसानी से बात कर सकें। टेक महिंद्रा के चीफ़ इनोवेशन ऑफ़िसर और AI और इमर्जिंग टेक्नोलॉजीज़ के ग्लोबल हेड, निखिल मल्होत्रा ​​ने कहा, “AI नेशनल डिजिटल इंफ्रास्ट्रक्चर और इनक्लूसिव ग्रोथ का सेंटर बनता जा रहा है, लेकिन ग्लोबल फ़ाउंडेशनल मॉडल अक्सर भारत जैसे गहरी भाषाई और सांस्कृतिक विविधता वाले देशों के लिए डिज़ाइन नहीं किए जाते हैं। इंडस्ट्री की एक बड़ी चुनौती लोकल भाषाओं और सीखने के कॉन्टेक्स्ट, खासकर एजुकेशन में, पर आधारित डोमेन-ट्रेंड लैंग्वेज मॉडल की कमी है। प्रोजेक्ट इंडस के ज़रिए, NVIDIA के साथ हमारा कोलेबोरेशन सीधे इस कमी को पूरा करता है। यह एक हिंदी-फ़र्स्ट, सॉवरेन AI मॉडल देता है जो भारत के लिए स्केलेबल, रेलिवेंट और एक्सेसिबल AI-पावर्ड लर्निंग और सिटिज़न-सेंट्रिक सर्विसेज़ को इनेबल करता है।”

जैसे-जैसे प्रोजेक्ट डेवलप हुआ, टेक महिंद्रा ने सॉवरेन मॉडल के डेवलपमेंट को तेज़ करने के लिए NVIDIA नेमोट्रॉन इकोसिस्टम से एडवांसमेंट्स को एक्सप्लोर किया। इन फ्यूचर एनहांसमेंट्स से ट्रेनिंग साइकिल्स के छोटे होने और इंडिया-स्पेसिफिक एजुकेशन और पब्लिक-सेक्टर की ज़रूरतों के लिए इंस्ट्रक्शन की क्वालिटी में सुधार होने की उम्मीद है।

1.2 बिलियन पैरामीटर्स वाले पहले के फ़ाउंडेशनल मॉडल पर बनाते हुए, कंपनी ने प्रोजेक्ट इंडस को 8-बिलियन-पैरामीटर आर्किटेक्चर तक बढ़ाया, जो मॉडल कैपेबिलिटी में एक काफ़ी बढ़ोतरी दिखाता है।

(इनपुट- ANI)