जब यह सोच सामने आई कि क्यों न भारत भी अपना आर्टिफिशियल इंटेलिजेंस (AI) आधारभूत माॅडल तैयार करे, तब यह सवाल सभी को परेशान कर रहा था कि क्या वैश्विक स्तर पर तकनीकी रूप से खुद को साबित कर चुके गूगल (Google) समेत कई अन्य संस्थानों ने एआई का जो मॉडल तैयार किया है, ज्यादातर भारतीय भाषाओं में हम वही एक्यूरेसी लाने में सक्षम हो पाएंगे?
'हनूमान', हिंदू देवता हनुमान के नाम पर ओपन-सोर्स भारतीय भाषा एआई मॉडल की एक श्रृंखला, भारतीय प्रौद्योगिकी संस्थान-बॉम्बे (IIT-B) द्वारा ऐसी ही एक परियोजना का परिणाम है। सीता महालक्ष्मी हेल्थकेयर (एसएमएल) के साथ साझेदारी में विकसित हनूमान कई भारतीय भाषाओं में लिखना और बोलना, दोनों कर सकता है। इस मॉडल का पहला संस्करण मार्च के अंत में लॉन्च होने वाला है।
रिलायंस जियो और एसएमएल
आईआईटी-बी ने भारतजीपीटी पारिस्थितिकी तंत्र को विकसित करने के लिए दूरसंचार ऑपरेटर रिलायंस जियो और चिकित्सा उपकरण निर्माता एसएमएल जैसे उद्योग भागीदारों के साथ भी काम किया है। आईआईटी-बी में कंप्यूटर विज्ञान और इंजीनियरिंग विभाग के अध्यक्ष प्रोफेसर और परियोजना के प्रमुख गणेश रामकृष्णन ने कहा, "हमारा लक्ष्य, भारत के लिए उत्पादक एआई क्षमताओं का निर्माण करना है, जो देश में एआई की बड़ी आवश्यकता को पूरा करने के लिए तकनीकी नवाचार के साथ भारतीय भाषाई और सांस्कृतिक विरासत को जोड़ता है।
केंद्र सरकार का एआई मिशन, जिसके तहत वह एक संप्रभु 10,000 ग्राफिक्स प्रोसेसिंग यूनिट (जीपीयू) सुपरकंप्यूटर स्थापित करने की योजना बना रही है, ऐसी परियोजनाओं के लिए काम आना चाहिए। हनूमान का पहला संस्करण 11 भारतीय भाषाओं में बातचीत करेगा। बाद के संस्करण में इस क्षमता का विस्तार सभी 22 आधिकारिक भारतीय भाषाओं में किया जाएगा। गिते ने कहा कि अभी तक, तमिलनाडु, कर्नाटक और तेलंगाना सहित कई राज्यों ने हनूमान परियोजना के साथ सहयोग करने में रुचि व्यक्त की है। हनूमान का वर्तमान ध्यान स्वास्थ्य सेवा पेशेवरों के सामने आने वाली चुनौतियों का समाधान करने, डॉक्टरों की बातचीत को रिकॉर्ड करने और सारांशित करने के लिए स्वचालित भाषण सारांश का लाभ उठाने पर है।
सार्वजनिक भलाई के प्रति समर्पण
शिक्षा क्षेत्र में, मॉडल का उपयोग छात्रों को उनके गृहकार्य और शिक्षकों को सीखने के परिणाम गतिविधियों में सहायता करने के लिए किया जा सकता है। रामकृष्णन ने कहा, "हनूमान स्वयं भगवान हनुमान से प्रेरित परोपकारी शक्ति से उधार लेते हैं और यह सार्वजनिक भलाई के प्रति हमारे समर्पण को दर्शाता है। "हम उत्पादक एआई की अपार शक्ति का उपयोग केवल दूसरों के लाभ के लिए कर रहे हैं, न कि व्यक्तिगत लाभ के लिए।"
एसएमएल में परियोजना निदेशक अमोल गीते ने कहा कि मॉडल का पहला ओपन-सोर्स मॉडल संस्करण, संभवतः 7 बिलियन मापदंडों के साथ लॉन्च किया जाएगा। हालांकि, यह AI मॉडल प्रगतिशील है और अगर हमारे पास एक बेहतर मॉडल तैयार करने की क्षमता है, तो हम ऐसा कर सकते हैं। उन्होंने कहा कि हनूमान की योजना उद्योग की मांग के आधार पर मौजूदा संख्या 1,024 को इंडस्ट्री जीपीयू से ज्यादा बढ़ाने की है। रामकृष्णन ने कहा कि एसएमएल के संस्थापक विष्णु वर्धन हनुमान परियोजना में निवेशक हैं।
रामकृष्णन ने कहा, "प्रत्येक क्षेत्र की अपनी बारीकियां होंगी। सिर्फ इसलिए कि आप एक मूलभूत मॉडल का निर्माण करते हैं इसका मतलब यह नहीं है कि आपने अपना काम कर लिया है... शिक्षा क्षेत्र में, आपको बोलने के तरीके से निपटना होगा। इसके अलावा, आपको कई बार अलग-अलग लहजे और अलग-अलग बोलियों को पकड़ने में सक्षम होना चाहिए।"
पूर्ण स्टैक पेशकश के साथ
इस परियोजना में बैंकिंग और वित्त सहित अन्य क्षेत्रों और मनोरंजन जैसी परिवर्तनकारी चुनौतियों वाले उद्योगों की रुचि भी देखी गई है। हनूमान ने पहले ही उद्योगों के साथ जुड़ना शुरू कर दिया है और उनमें से कुछ के लिए समाधान प्रदान करना शुरू कर दिया है। यह प्रदान की जाने वाली पूर्ण स्टैक पेशकश के साथ, यह उद्यम ग्राहकों के लिए एक बंद-स्रोत मॉडल पेश करने पर भी विचार कर रहा है।
"उद्यम वर्तमान में चैटजीपीटी जैसे मॉडल का उपयोग करते हैं और अपने हर लेन-देन के लिए भारी भुगतान कर रहे हैं। इसके अलावा, उनके लिए सबसे बड़ी आशंका डाटा साझा करने की है। अगर हम कुछ ऐसा पेश कर रहे हैं, जो उनके अपने परिसर में होने जा रहा है, तो मुझे नहीं लगता कि यह लागत का होगा, बल्कि क्षमता का सवाल होगा।
स्वास्थ्य सेवा के लिए आधार मॉडल बनाने को लेकर वर्धन ने आईआईटी-बी के साथ काम किया था। उन्होंने बड़ी मात्रा में कम्प्यूटेशनल क्षमता प्राप्त करने के लिए हनूमान परियोजना में निवेश किया, जो ऐसे मॉडल के निर्माण के लिए आवश्यक है। उन्होंने कहा कि अन्य योगदानों पर अभी भी चर्चा चल रही है और उन्हें अंतिम रूप दिया जाना बाकी है।
हनूमान की पहली झलक
मुंबई में वार्षिक नैसकॉम आईटी उद्योग सम्मेलन में जनता को हनूमान की पहली झलक मिली। प्रदर्शित वीडियो ने मोटरसाइकिल मैकेनिक, बैंकर और डेवलपर के रूप में एआई मॉडल की क्षमताओं का प्रदर्शन किया, जो अपनी मूल भाषाओं में उपकरण के साथ बातचीत करते हैं।
भारतीय उद्यमियों ने पहले मूलभूत भाषा मॉडल के प्रशिक्षण के लिए भारतीय भाषाओं में डाटासेट की उपलब्धता पर सवाल उठाए हैं। अंग्रेजी-आधारित चैटबॉट कुछ समय से सिस्टम में हैं, लेकिन स्थानीय भाषाओं, विशेष रूप से कम संसाधनों वाले लोगों के लिए बॉट बनाने में महत्वपूर्ण कठिनाई उत्पन्न होती है। एलएलएम को प्रशिक्षित करने और बनाने के लिए संसाधनों की आवश्यकता होती है, लेकिन सवाल यह है कि डेटासेट कहां से आएंगे। एआई स्टार्टअप के संस्थापक ने कहा कि सबसे स्पष्ट विकल्प यह है कि सरकार अपने भाषा पुस्तकालयों तक पहुंच खोले।
एसएमएल में परियोजना निदेशक अमोल गीते ने कहा कि मॉडल का पहला संस्करण, एक ओपन-सोर्स मॉडल, संभवतः 7 बिलियन मापदंडों के साथ लॉन्च किया जाएगा। "हालांकि, यह AI मॉडल प्रगतिशील है और अगर हमारे पास एक बेहतर मॉडल तैयार करने की क्षमता है, तो हम ऐसा कर सकते हैं।