प्रकाश मेहरा
ओला कैब के सह- संस्थापक भाविश अग्रवाल ने एक स्टार्टअप की घोषणा की है। उन्होंने कहा कि यह ‘भारत का अपना’ कृत्रिम बुद्धिमत्ता (एआई) मॉडल बना रहा है। सरकार भी ‘भारत एआई कार्यक्रम’ के बारे में बात करती रही है। इन परियोजनाओं का उद्देश्य एक ऐसा एआई मॉडल विकसित करना है, जो भारत से संबंधित जानकारियों के डाटासेट से प्रशिक्षित हो सके। इससे भारतीय एआई देसी भाषाओं और संस्कृति के आधार पर काम करेगा।
देश के हिसाब से बनाया जाएगा
भारतीय एआई का संदर्भ उन डाटासेट से है, जिन पर एआई मॉडल को प्रशिक्षित किया जाएगा। भारतीय एआई देसी भाषाओं, देश की सामाजिक स्थिति व इससे संबंधित पूर्वाग्रह, राजनीति और भारत केंद्रित मामलों की बारीकियों को समझने लायक बनाया जाएगा। विशेषज्ञों का कहना है कि ऐसे कारक एआई को देश और संस्कृति के हिसाब से अलग बना देंगे।
भारतीय भाषाएं होंगी
इलेक्ट्रॉनिक्स और सूचना प्रौद्योगिकी मंत्रालय की आगामी एआई नीति ‘भारत एआई कार्यक्रम’ की घोषणा 10 जनवरी को की जाएगी। इस कार्यक्रम का महत्वपूर्ण हिस्सा डाटासेट बनाने का होगा, जहां मंत्रालय का डाटा कार्यालय केंद्र सरकार के विभागों और निजी संगठनों के माध्यम से एकत्र किए गए डाटा को संभालेगा। इस डाटासेट में भारत में बोली जाने वाली भाषाएं शामिल होंगी।
डाटाबेस तक पहुंच होगी
शोधकर्ताओं के पास भारतीय भाषाओं के डाटाबेस तक पहुंच होगी। स्वदेशी कंप्यूटिंग पावर विकसित करने को मॉड्यूल होगा। इसमें डाटा सेंटर और कस्टम सिलिकॉन डिजाइन भी शामिल होगे। यह बाद में सार्वजनिक-निजी भागीदारी के माध्यम काम करेगा।
अब तक ये प्रयास
स्टार्टअप सर्वम एआई ने हिंदी के लिए एक ओपन- सोर्स भाषा मॉडल पेश किया है। सर्वम का एआई मॉडल, ‘ओपनहाथी-हाय-0.1’ भारत में पहला मॉडल है, जो मूल रूप से गैर-अंग्रेजी डाटासेट में प्रशिक्षित है।
क्या है चुनौतियां
एक बड़ी समस्या भारतीय भाषाओं में सार्वजनिक रूप से उपलब्ध डाटासेट की कमी है। इससे मूलभूत मॉडलों के लिए पर्याप्त डाटा प्राप्त करना मुश्किल हो जाता है। जबकि हितधारक भारतीय भाषा में डाटा की उपलब्धता बढ़ाने के लिए डिजिटलीकरण कर रहे हैं।