आर्टिफिशियल इंटेलिजेंस (एआई) में भारत को बदलने की अपार संभावनाएं हैं, जो शासन, स्वास्थ्य देखभाल, कृषि, वित्तीय सेवाओं और बहुत कुछ में चुनौतियों का समाधान पेश करती है। हालाँकि, एआई की पूरी क्षमता का लाभ उठाने के लिए भारत की भाषाई, सांस्कृतिक और ढांचागत वास्तविकताओं के लिए विशिष्ट रूप से अनुकूल एआई सिस्टम विकसित करने की आवश्यकता है। इसके लिए स्थानीयकृत एआई मॉडल, मजबूत डेटा संप्रभुता और कंप्यूटिंग बुनियादी ढांचे के लिए एक वितरित दृष्टिकोण की आवश्यकता है।
स्थानीयकृत AI मॉडल क्यों आवश्यक हैं?
आज दुनिया के सबसे लोकप्रिय एआई मॉडल मुख्य रूप से अंग्रेजी भाषा में डेटा का उपयोग करके प्रशिक्षित किए जाते हैं। इसका मतलब यह है कि इन मॉडलों के उपयोग का परिणाम भाषाई और सांस्कृतिक दृष्टिकोण से एंग्लो-केंद्रित लेंस की ओर अधिक झुका हुआ है। 22 आधिकारिक भाषाओं और सैकड़ों नहीं तो हजारों बोलियों के साथ भारत की भाषाई विविधता, बड़े और छोटे दोनों तरह के स्थानीय भाषा मॉडल को समावेशी एआई अपनाने के लिए आवश्यक बनाती है।
एक ओर, बड़े भाषा मॉडल (एलएलएम) को भारतीय भाषा डेटा में प्रशिक्षित करना, भारतीय बारीकियों को समझने और भारतीय भाषाओं में पाठ तैयार करने के लिए तैयार करना महत्वपूर्ण है। इस प्रकार का स्थानीयकृत एआई मॉडल सांस्कृतिक पूर्वाग्रहों को कम करता है और सरकारी सेवाओं और शिक्षा जैसे अनुप्रयोगों में प्रासंगिकता में सुधार करता है। वे सुनिश्चित करते हैं कि इन एआई समाधानों के परिणाम सभी भारतीयों के लिए अधिक प्रासंगिक और सुलभ हों, जिनमें अंग्रेजी नहीं बोलने वाले लोग भी शामिल हैं। उदाहरण के लिए टेक महिंद्रा द्वारा इंडस एलएलएम – एक स्वदेशी मूलभूत मॉडल जिसे कई इंडिक भाषाओं और बोलियों में बातचीत करने के लिए डिज़ाइन किया गया है, जिसे एक अभिनव ‘जेनएआई-इन-ए-बॉक्स’ ढांचे का उपयोग करके कार्यान्वित किया गया है।
दूसरी ओर, छोटे भाषा मॉडल (एसएलएम) जो कम संख्या में मापदंडों पर आधारित होते हैं, उन्हें क्षेत्रीय भाषा अनुवाद और उद्योग-विशिष्ट ग्राहक सेवा चैटबॉट जैसे स्थानीय अनुप्रयोगों के लिए अधिक आसानी से ठीक किया जाता है। इसके लिए काफी कम कंप्यूटिंग शक्ति की भी आवश्यकता होती है, जो उन्हें हमारे पर्यावरण के लिए आदर्श बनाता है, एआई को बड़े पैमाने पर सक्षम करने के लिए एआई पीसी, मोबाइल या एज कंप्यूटिंग उपकरणों का उपयोग करता है, जिससे पूरे समाज में लाभ मिलता है, ठीक उसी तरह जैसे आधार और यूपीआई ने प्रभाव डाला है।
इन मॉडलों को विकसित करने के लिए भारतीय भाषाओं में विशाल डेटासेट के संग्रह की आवश्यकता होती है, जिसे क्राउडसोर्सिंग और शिक्षा जगत, उद्योग और सरकार के बीच सहयोग के माध्यम से प्राप्त किया जा सकता है। मॉडलों से परे, हमें वास्तविक चुनौतियों को बड़े पैमाने पर हल करने के लिए इन मॉडलों के अनुप्रयोगों पर भी ध्यान केंद्रित करना चाहिए, जो हमारे लिए महत्वपूर्ण बिंदु हो सकता है।
डेटा स्थानीयकरण: एक रणनीतिक अनिवार्यता
भारत लगभग योगदान देता है वैश्विक डेटा का 20 प्रतिशतफिर भी इसका अधिकांश भाग विदेशी सर्वरों में संग्रहीत है। एआई के लिए डेटा सबसे मूल्यवान इनपुट है और हमारे पास इसकी बहुतायत है। जबकि सुरक्षा, अनुपालन और शासन के लिए डेटा स्थानीयकरण के महत्व पर व्यापक रूप से चर्चा की गई है, एक कम ज्ञात तथ्य यह है कि डेटा स्थानीयकरण एआई तैनाती के लिए भी महत्वपूर्ण लाभ प्रदान करता है।
एक के लिए, जब डेटा को देश के भीतर संग्रहीत और संसाधित किया जाता है, तो यह सीमा पार डेटा स्थानांतरण से जुड़ी विलंबता को कम कर देता है, जिसके परिणामस्वरूप अधिक कुशल एआई संचालन होता है। दूसरे के लिए, लंबे समय में विदेशी क्लाउड सेवाओं का उपयोग करने की तुलना में भारत के भीतर डेटा केंद्रों पर भरोसा करना अधिक लागत प्रभावी हो सकता है, क्योंकि सदस्यता लागत और अंतरराष्ट्रीय सीमाओं के पार बड़ी मात्रा में डेटा स्थानांतरित करना अधिक है। इसके अलावा स्थानीय डेटा होने का मतलब है कि स्थानीय संदर्भ को बेहतर ढंग से समझा जा सकेगा और हमारे द्वारा विकसित एप्लिकेशन अधिक प्रासंगिक होंगे।
जबकि स्थानीय डेटा केंद्र स्थापित करने के लिए प्रारंभिक पूंजीगत व्यय महत्वपूर्ण हो सकता है, भारत सरकार और निजी क्षेत्र डेटा सेंटर क्षमता का विस्तार करने में भारी निवेश कर रहे हैं, जो अंततः पैमाने की अर्थव्यवस्थाओं के माध्यम से लागत को कम कर देगा क्योंकि अधिक सुविधाएं ऑनलाइन आती हैं और स्थानीय प्रदाताओं के बीच प्रतिस्पर्धा बढ़ती है। .
इसके अलावा, घरेलू डेटा केंद्रों पर भरोसा करके, संगठन स्थानीय अर्थव्यवस्था में योगदान करते हैं, नौकरियां पैदा करते हैं और देश के भीतर तकनीकी प्रगति को बढ़ावा देते हैं। इससे एआई विकास के लिए एक अधिक मजबूत पारिस्थितिकी तंत्र बन सकता है, जिससे सहयोग और नवाचार में वृद्धि के माध्यम से लागत में कमी आएगी।
स्थानीय डेटा केंद्रों में निवेश – राजमार्गों या अन्य बुनियादी ढांचे के निर्माण के समान, भारत के भविष्य के लिए महत्वपूर्ण है क्योंकि देश का लक्ष्य एआई पावरहाउस बनना है।
स्केलेबिलिटी के लिए वितरित गणना को अपनाना
जबकि भारत में डेटा केंद्रों का विस्तार आवश्यक है, एआई का भविष्य वितरित कंप्यूटिंग में निहित है – केंद्रीकृत सुविधाओं, एआई पीसी और एज कंप्यूटिंग के मिश्रण का लाभ उठाना।
यहाँ कारण हैं. सबसे पहले, सभी AI को डेटा सेंटर या क्लाउड के माध्यम से चलाना महंगा हो सकता है। चाहे वह स्थानीय डेटा केंद्रों का स्वामित्व हो, पट्टे पर हो, या स्थानीय क्लाउड सदस्यता पर निर्भर हो; संचालन और जटिलता कई संगठनों की पहुंच से बाहर हो सकती है। दूसरा, जबकि विदेशी डेटा केंद्रों के बजाय घरेलू डेटा केंद्रों पर भरोसा करना पहले से ही एक सुधार है, जहां डेटा उत्पन्न होता है और डेटा केंद्रों के बीच डेटा को आगे और पीछे भेजना अभी भी चीजों को धीमा कर सकता है, और भुगतान जैसे समय-संवेदनशील अनुप्रयोगों के लिए आदर्श नहीं है। सिस्टम और स्वास्थ्य देखभाल निगरानी। तीसरा, भारत के भीतर डेटा केंद्रों के साथ भी, कुछ संगठन सुरक्षा और गोपनीयता कारणों से अभी भी अपने डेटा को अपने परिसर में ही संग्रहीत करना पसंद करेंगे। लागत, विलंबता और सुरक्षा चिंताओं से परे। डेटा केंद्रों के बड़े पैमाने पर केंद्रीय मॉडल बनाने की पर्यावरणीय चुनौतियाँ भी हैं (उदाहरण के लिए, भारत के पास दुनिया के जल संसाधनों का लगभग 4 प्रतिशत है)। हमें डेटा केंद्रों के निर्माण के तरीके की फिर से कल्पना करनी होगी और कंप्यूटिंग का एक वितरित मॉडल हमारे लिए समाधान हो सकता है।
विभिन्न एआई उपयोग मामलों के लिए विभिन्न कंप्यूटिंग संसाधनों का उपयोग करते हुए, कंप्यूटिंग को स्थानों और उपकरणों में फैलाने की आवश्यकता है। लाखों पीसी और एज डिवाइस, ~ 950K सेल फोन टावर आदि के साथ, प्रत्येक गणना बिंदु एक एआई इंजन हो सकता है। जैसे-जैसे कंप्यूटिंग अधिक शक्तिशाली होती जा रही है, यदि आप इसे सीधे अपने पीसी पर या किनारे पर कर सकते हैं तो एक छोटे भाषा मॉडल को प्रशिक्षित क्यों करें या डेटा सेंटर में एआई एजेंट या एप्लिकेशन क्यों चलाएं? एज कंप्यूटिंग वास्तविक समय प्रसंस्करण को सक्षम बनाता है, नेटवर्क की भीड़ को कम करता है, और इंटरनेट कनेक्टिविटी बंद होने पर भी डेटा संसाधित करना जारी रख सकता है – तो केवल डेटा केंद्रों पर भरोसा क्यों करें?
एआई जटिल है, विभिन्न उपयोग के मामलों के लिए अलग-अलग कंप्यूटिंग आवश्यकताएं हैं। यह सुनिश्चित करने के लिए कि एआई सभी के लिए सुलभ है, हमें ऐसे बुनियादी ढांचे की फिर से कल्पना करनी चाहिए जो कंप्यूटिंग के लिए भारत की अतृप्त मांग को पूरा करने के लिए सबसे उपयुक्त हो।
भारत के एआई भविष्य के लिए एक दृष्टिकोण
के अनुसार आईडीसी एशिया/प्रशांत एआई परिपक्वता अध्ययन 2024इंटेल द्वारा कमीशन किया गया, भारत वर्तमान में एआई प्रैक्टिशनर स्तर पर एआई परिपक्वता के चरण 2 पर है। हालाँकि, एआई परिपक्वता सीढ़ी पर चढ़ने के लिए, भारत को ऊपर उल्लिखित क्षेत्रों को संबोधित करने के लिए कदम उठाने होंगे।
भारत का मजबूत सरकारी समर्थन, विशाल प्रतिभा आधार और समृद्ध डेटा स्रोत इसे एआई से जबरदस्त लाभ प्राप्त करने के लिए तैयार देश बनाते हैं। इन प्राथमिकताओं पर ध्यान केंद्रित करके, भारत एआई द्वारा लाई जा सकने वाली अविश्वसनीय क्षमता का बेहतर लाभ उठा सकता है, और इसका उपयोग अपने नागरिकों को अधिक न्यायसंगत रूप से सेवा देने के लिए कर सकता है।
भारत इस समय तेजी से अपने एआई बुनियादी ढांचे का विस्तार कर रहा है, और यह सुनिश्चित करना पहले से कहीं अधिक महत्वपूर्ण है कि अब रखी गई नींव उसके देश के लोगों को दीर्घकालिक सेवा प्रदान करेगी, और यह सुलभ, टिकाऊ और समावेशी है।
लेखक इंटेल, भारत क्षेत्र के उपाध्यक्ष और प्रबंध निदेशक हैं। व्यक्त किये गये विचार व्यक्तिगत हैं।