एआई की संप्रभुता और राष्ट्रीय भाषा मॉडल

AI संप्रभुता अब तकनीकी सम्मेलनों का नारा नहीं रही। देश भाषा मॉडल, सार्वजनिक डेटा और कंप्यूटिंग शक्ति को एक महत्वपूर्ण बुनियादी ढांचा तत्व मानने लगे हैं: जो ऊर्जा, दूरसंचार और साइबर सुरक्षा के समान है। दांव यह नहीं है कि क्या हर नागरिक ChatGPT के राष्ट्रीय समकक्ष का उपयोग करेगा। दांव यह है कि प्रशासन, अदालतें, सार्वजनिक स्वास्थ्य और सुरक्षा क्षेत्र किसी बाहरी API पर निर्भर होंगे जिसे देश नियंत्रित नहीं करता है। 2025 में Linux Foundation ने संप्रभु AI को एक बढ़ते वैश्विक रुझान के रूप में वर्णित किया, जिसमें डेटा, मॉडल, बुनियादी ढांचे और स्थानीय सांस्कृतिक-कानूनी अनुकूलन पर नियंत्रण राज्य की रणनीति का तत्व बन रहा है। 2026 में यह प्रवृत्ति पहले से ही व्यवहार में दिखाई दे रही है: कनाडा संप्रभु कंप्यूटिंग बुनियादी ढांचा कार्यक्रम विकसित कर रहा है, भारत राष्ट्रीय GPU पूल तक पहुंच बना रहा है, पोलैंड PLLuM परिवार विकसित कर रहा है, और यूक्रेन Gemma के खुले परिवार पर आधारित एक राष्ट्रीय LLM तैयार कर रहा है। संप्रभुता AI का वास्तव में क्या मतलब है?

AI संप्रभुता किसी देश या देशों के समूह की क्षमता है कि वह सुरक्षा, अर्थव्यवस्था और सार्वजनिक सेवाओं के लिए महत्वपूर्ण क्षेत्रों में कृत्रिम बुद्धिमत्ता प्रणालियों को विकसित, लागू और नियंत्रित कर सके। इसका मतलब पूर्ण तकनीकी आत्मनिर्भरता नहीं है। आज कोई भी मध्यम आकार का देश पूरी श्रृंखला को नियंत्रित नहीं करता है: सेमीकंडक्टर लिथोग्राफी से लेकर GPU, डेटा केंद्र, आधार मॉडल, डेटा, एप्लिकेशन और नियमन तक। अधिक यथार्थवादी लक्ष्य लचीलापन (resilience) है: सबसे खतरनाक निर्भरताओं को सीमित करना, संवेदनशील डेटा पर नियंत्रण बनाए रखना, प्रणालियों का ऑडिट करने की क्षमता और कार्य करने की क्षमता तब भी जब मूल्य निर्धारण, नियमन, भू-राजनीति या विदेशी आपूर्तिकर्ता की उपलब्धता बदल जाए। संप्रभु एआई की चार परतें कंप्यूट: राज्य के क्षेत्र में या एक विश्वसनीय कानूनी क्षेत्र में कंप्यूटिंग शक्ति तक पहुंच। डेटा: सार्वजनिक और क्षेत्र-विशिष्ट डेटा सेटों पर नियंत्रण, उनके लाइसेंस, गुणवत्ता और सुरक्षा। मॉडल: एक बंद प्रदाता पर पूर्ण निर्भरता के बिना मॉडल चलाने, ऑडिट करने, फाइन-ट्यून करने और अपडेट करने की क्षमता। अनुकूलन: स्थानीय भाषा, कानून, प्रशासनिक मानदंडों और संस्थागत संस्कृति के साथ प्रतिक्रियाओं की अनुरूपता। राष्ट्रीय भाषा मॉडल इस स्टैक का केवल एक तत्व हैं। डेटा, बुनियादी ढांचे और कार्यान्वयन प्रक्रिया के बिना मॉडल एक शोध परियोजना है। केवल मॉडल को रजिस्ट्रियों, ज्ञानकोशों, सुरक्षित होस्टिंग, ऑडिटिंग और प्रक्रियाओं के साथ जोड़ना ही राज्य के लिए वास्तविक मूल्य बनाता है। राज्य अपने स्वयं के मॉडल क्यों चाहते हैं?

सबसे पहले: डेटा। प्रशासन कर, स्वास्थ्य, न्यायिक, कार्मिक, बुनियादी ढांचे और सुरक्षा जानकारी पर काम करता है। उन्हें सार्वजनिक चैटबॉट्स या अनियंत्रित क्लाउड सेवाओं पर भेजना एक कानूनी और परिचालन जोखिम है। दूसरे: कानून। एक वैश्विक मॉडल पोलिश में अच्छा लिख सकता है, लेकिन उसे प्रशासनिक प्रक्रिया, कानूनी कृत्यों की स्थानीय शैली, आधिकारिक अभ्यास या सामान्य सलाह और बाध्यकारी व्याख्या के बीच अंतर को समझना आवश्यक नहीं है। तीसरे: परिचालन निरंतरता। यदि कोई प्रमुख सार्वजनिक सेवा बाहरी एपीआई पर निर्भर करती है, तो राज्य मूल्य वृद्धि, निर्यात प्रतिबंधों, विफलताओं, राजनीतिक विवादों या उपयोग की शर्तों में बदलाव के प्रति संवेदनशील होता है। चौथा: स्थानीय पारिस्थितिकी तंत्र। भाषा और कानून के अनुकूल खुला मॉडल स्टार्टअप्स, SMEs, कॉलेजों और इंटीग्रेटर्स के लिए आधार बन सकता है, जिन्हें शून्य से शुरू नहीं करना पड़ता या हर प्रयास के लिए विदेशी आपूर्तिकर्ता को भुगतान नहीं करना पड़ता। तकनीकी रूप से यह कैसे काम करता है वर्तमान परियोजनाओं का सबसे महत्वपूर्ण निष्कर्ष सरल है: अधिकांश देश मॉडल शून्य से नहीं बनाते हैं। एक पूर्ण प्री-ट्रेनिंग फ्रंटियर मॉडल बहुत महंगा और कंप्यूटिंग शक्ति पर अत्यधिक निर्भर है। इसके बजाय, देश और संघ खुले वज़न मॉडल को अनुकूलित करते हैं, स्थानीय भाषा में अतिरिक्त प्रशिक्षण देते हैं और प्रशासन, कानून और सार्वजनिक सेवाओं के अनुरूप उदाहरणों पर मॉडल को निर्देशानुसार ट्यून करते हैं। दूसरा स्तंभ RAG है, यानी रिट्रीवल-ऑगमेंटेड जनरेशन। मॉडल को वज़न में पूरे वर्तमान कानूनी ज्ञान की आवश्यकता नहीं होती है। यह एक भाषाई परत के रूप में कार्य कर सकता है जो प्रमाणित डेटाबेस से संदर्भ प्राप्त करता है: क़ानूनों के जर्नल, न्यायिक फैसलों, विनियमों, रजिस्टरों और प्रक्रियाओं। इसके कारण उत्तर वर्तमान दस्तावेज़ पर आधारित हो सकता है, न कि प्रशिक्षण के दिन मॉडल की स्मृति पर। तीसरा स्तंभ ऑडिट (लेखापरीक्षा) है। प्रशासन में यह पर्याप्त नहीं है कि उत्तर विश्वसनीय लगे। सिस्टम को स्रोतों, परिचालन तर्क पथ (operational reasoning path), मॉडल संस्करण, इनपुट डेटा और निर्णय के लिए जिम्मेदार व्यक्ति को लॉग करना होगा। विशेष रूप से यूरोप में EU AI Act है, जो रोजगार, शिक्षा, कानून प्रवर्तन या सेवाओं तक पहुंच में कुछ अनुप्रयोगों को उच्च जोखिम वाली प्रणालियों के रूप में वर्गीकृत करता है। पोलैंड: स्थानीय भाषाई परत के रूप में PLLuM पोलिश प्रोजेक्ट PLLuM यूरोपीय दृष्टिकोण का एक उदाहरण है: अमेरिका या चीन की तुलना में अपेक्षाकृत सीमित बजट, लेकिन भाषा, प्रशासन और खुलेपन पर मजबूत ध्यान। डिजिटलाइज़ेशन मंत्रालय ने मई 2026 में PLLuM परिवार के 11 नए मॉडल जोड़ने की घोषणा की, जो 4B, 8B, 12B और 70B वेरिएंट में हैं। छोटे मॉडल व्यावहारिक महत्व रखते हैं क्योंकि उन्हें स्थानीय रूप से लागू करना, कम लागत पर बनाए रखना और विशिष्ट प्रक्रियाओं के अनुकूल बनाना आसान होता है। सबसे महत्वपूर्ण यह नहीं है कि PLLuM सबसे बड़े फ़्रंटियर मॉडलों को पछाड़ पाएगा या नहीं। सबसे महत्वपूर्ण यह है कि क्या यह विशिष्ट कार्यों के लिए पर्याप्त अच्छा होगा: दस्तावेज़ों का सारांश बनाना, मामलों का वर्गीकरण करना, अधिकारियों का समर्थन करना, दस्तावेज़ भाषा को सरल बनाना, पोलिश कानून पर काम करना और डिजिटल चैनलों में नागरिक सेवा प्रदान करना। ऐसे अनुप्रयोगों में, एक स्थानीय मॉडल, जो RAG और प्रशासनिक डेटा के साथ अच्छी तरह से जुड़ा हुआ है, बड़े सामान्य मॉडल की तुलना में अधिक उपयोगी हो सकता है। कनाडा: रणनीति का आधार कंप्यूट कनाडा ने दिखाया है कि AI संप्रभुता कंप्यूटिंग शक्ति से शुरू होती है। 'Canadian Sovereign AI Compute Strategy', जो 2024 के बजट से बड़े निवेशों के हिस्से के रूप में घोषित की गई थी, ध्यान अनुसंधान वित्तपोषण से हटाकर बुनियादी ढांचे पर ले जाती है। 'AI Sovereign Compute Infrastructure Program' का उद्देश्य राष्ट्रीय कंप्यूट बुनियादी ढांचे के निर्माण और रखरखाव का समर्थन करना है, और आधिकारिक दस्तावेज़ बताते हैं कि क्रमिक वित्तीय वर्षों में बुनियादी ढांचा विकास परत के लिए लगभग 890 मिलियन CAD खर्च होंगे। यह अन्य देशों के लिए एक महत्वपूर्ण संकेत है: जीपीयू (GPU), ऊर्जा, शीतलन, डेटा केंद्रों और बुनियादी ढांचे के ऑपरेटरों के बिना, सबसे अच्छी मॉडल रणनीति भी केवल एक प्रस्तुति बनी रहेगी। कंप्यूट एक रणनीतिक संसाधन बन जाता है, न कि आईटी बजट में सिर्फ एक सामान्य मद। भारत: भाषाई पैमाना और जीपीयू तक सार्वजनिक पहुंच भारत एक विशेष मामला है क्योंकि इसकी समस्या केवल अपना मॉडल बनाना नहीं है। देश को भाषाओं, बोलियों, वर्णमालाओं और डिजिटल सेवाओं तक पहुंच के स्तर की विशाल श्रृंखला को संभालना होगा। IndiaAI Compute Portal शोधकर्ताओं, स्टार्टअप्स और संस्थानों के लिए कंप्यूटिंग शक्ति तक पहुंच का लोकतंत्रीकरण करना चाहता है। सार्वजनिक घोषणाओं में पहले से ही दसियों हज़ार GPU का पूल और संसाधनों के विस्तार की योजनाएं इंगित की गई थीं। भारतीय सबक सरल है: भाषाई संप्रभुता केवल मॉडल से नहीं आती। डेटा, संसाधनों का डिजिटलीकरण, आवाज, OCR, अनुवाद और वे उपकरण आवश्यक हैं जो नागरिक के राज्य के साथ वास्तविक संपर्क चैनलों में काम करते हैं। एक बहुभाषी देश में, एक ऐसा मॉडल जो केवल अंग्रेजी को अच्छी तरह से संभालता है, वह सार्वजनिक बुनियादी ढांचा नहीं है। यूक्रेन: युद्ध की स्थिति में हाइब्रिड मॉडल यूक्रेन कीवस्टार और डिजिटल ट्रांसफॉर्मेशन मंत्रालय के सहयोग से एक राष्ट्रीय LLM का निर्माण कर रहा है। यूक्रेनी पक्ष के बयानों के अनुसार, मॉडल 2026 में बीटा संस्करण में लॉन्च होगा, और तकनीकी आधार के रूप में Google के Gemma परिवार को चुना गया है, जिसे यूक्रेनी भाषा और संदर्भ के अनुकूल बनाया गया है। यह परियोजना सार्वजनिक-निजी सहयोग से वित्तपोषित और विकसित की जा रही है, जिसमें मॉडल को राज्य को सौंपने की योजना है। यह एक पारंपरिक सरकारी अनुसंधान संस्थान से अलग रास्ता दिखाता है। दूरसंचार ऑपरेटर तकनीकी विशेषज्ञता और कार्यान्वयन क्षमता प्रदान करता है, जबकि राज्य संदर्भ, लक्ष्य और विश्वसनीय डेटा प्रदान करता है। राष्ट्रीय सुरक्षा की स्थिति में ऐसा मॉडल कई साल के सार्वजनिक आदेशों की तुलना में तेज़ हो सकता है, लेकिन इसके लिए स्वामित्व, ऑडिट और पहुंच के स्पष्ट नियमों की आवश्यकता होती है। सबसे बड़े लाभ डेटा सुरक्षा: संवेदनशील दस्तावेज़ों को वैश्विक मॉडल को शक्ति दिए बिना स्थानीय रूप से या विश्वसनीय क्लाउड में संसाधित किया जा सकता है। सार्वजनिक सेवाओं की बेहतर गुणवत्ता: सहायक नागरिकों को जटिल नियमों का अनुवाद कर सकते हैं, प्रक्रियाओं को सारांशित कर सकते हैं और अधिकारियों का समर्थन कर सकते हैं। विक्रेता लॉक-इन का कम जोखिम: राज्य के पास माइग्रेशन, ऑडिट और स्थानीय कार्यान्वयन की क्षमता बनी रहती है। स्थानीय कंपनियों का विकास: खुले मॉडल और राष्ट्रीय बुनियादी ढांचा हाइपरस्केलर पर पूर्ण निर्भरता के बिना एप्लिकेशन बनाने की अनुमति देते हैं। सांस्कृतिक अनुकूलता: मॉडल स्थानीय भाषा, कानून, प्रशासनिक शैली और सामाजिक संदर्भ को बेहतर ढंग से संभाल सकता है। सबसे बड़े जोखिम स्वतंत्रता का भ्रम। मॉडल राष्ट्रीय हो सकता है, लेकिन GPU, सिस्टम सॉफ्टवेयर, क्लाउड, लाइब्रेरी और सेमीकंडक्टर आपूर्ति श्रृंखला वैश्विक बनी रहती है। पूर्ण संप्रभुता अक्सर लचीलापन और विविधीकरण से कम यथार्थवादी होती है। कौशल अंतराल। सार्वजनिक प्रशासन मॉडल को वित्तपोषित कर सकता है, लेकिन यदि निजी क्षेत्र बहुत अधिक भुगतान करता है तो MLOps, सुरक्षा, मूल्यांकन, एकीकरण और डेटा की टीमें बनाए रखना कठिन होगा। तकनीक का पुराना होना। सरकारी परियोजना का विकास चक्र वाणिज्यिक प्रयोगशालाओं के चक्र से धीमा होता है। यदि परियोजना को एक जीवित बुनियादी ढांचे के बजाय क्लासिक आईटी सिस्टम के रूप में चलाया जाता है, तो राष्ट्रीय मॉडल आधिकारिक लॉन्च के दिन ही पुराना हो सकता है। उच्च गुणवत्ता वाले डेटा की कमी। देश के पास विशाल अभिलेखागार हो सकते हैं, लेकिन यदि वे स्कैन में, पुराने प्रारूपों में, साइलो में या स्पष्ट लाइसेंस के बिना हैं, तो वे तुरंत प्रशिक्षण या RAG के लिए तैयार नहीं होते हैं। मिथक और वास्तविकता मिथक वास्तविकता क्या है संप्रभु एआई का मतलब सब कुछ शुरू से बनाना है। इसका सबसे अधिक अर्थ खुले मॉडल को अनुकूलित करना, स्थानीय डेटा, मालिकाना परिनियोजन और महत्वपूर्ण परतों पर नियंत्रण है। राष्ट्रीय एलएलएम नागरिकों के लिए चैटजीपीटी की जगह लेगा। मुख्य उपयोग प्रशासन, सुरक्षा, कानून, शिक्षा और सार्वजनिक सेवाएँ हैं, न कि मनोरंजन या सार्वभौमिक चैटबॉट। बस जीपीयू खरीदना काफी है। कंप्यूट आवश्यक है, लेकिन डेटा, टीमों, प्रक्रियाओं और एकीकरण के बिना यह एक महंगा सर्वर रूम बना रहेगा। ओपन सोर्स स्वचालित रूप से स्वतंत्रता देता है। खुले वज़न मदद करते हैं, लेकिन अभी भी डेटा लाइसेंस, बुनियादी ढांचा, ऑडिट और रखरखाव की आवश्यकता है। वर्ष 2026-2035 के लिए परिदृश्य सावधानीपूर्ण परिदृश्य: राष्ट्रीय मॉडल मुख्य रूप से पायलट प्रोजेक्ट बने रहते हैं। प्रशासन डेटा स्थानीयकरण की अतिरिक्त गारंटी के साथ वाणिज्यिक क्लाउड का उपयोग करता है, लेकिन गहरे मॉडलिंग कौशल का निर्माण नहीं करता है। आधारभूत परिदृश्य: एक हाइब्रिड बाजार बनता है। स्थानीय मॉडल आधिकारिक मामलों, भाषा, कानून और संवेदनशील डेटा को संभालते हैं, जबकि वाणिज्यिक फ्रंटियर मॉडल कम जोखिम वाले या अनुसंधान कार्यों के लिए उपयोग किए जाते हैं। ब्रेकथ्रू परिदृश्य: इन्फ्रेंस लागत में गिरावट, मजबूत खुले मॉडल और कंप्यूट में यूरोपीय निवेश मध्यम आकार के देशों को अपने स्वयं के, बहुत अच्छे डोमेन मॉडल बनाए रखने की अनुमति देते हैं। बिग टेक गायब नहीं होता है, लेकिन सार्वजनिक खरीद में अपना एकाधिकार खो देता है। सार्वजनिक संस्थानों को क्या करना चाहिए डेटा का ऑडिट करें: दस्तावेज़ कहाँ हैं, उनके लाइसेंस क्या हैं, गुणवत्ता, प्रारूप और कानूनी स्थिति क्या है। संवेदनशील डेटा वाले मानव संसाधन, वित्तीय, चिकित्सा और प्रशासनिक दस्तावेज़ों के लिए सार्वजनिक चैटबॉट्स के उपयोग पर प्रतिबंध लगाना। RAG के लिए तैयार ज्ञान भंडार बनाना: अद्यतन, संस्करणित, उद्धृत करने योग्य और नियंत्रित। संकीर्ण प्रक्रियाओं में स्थानीय मॉडल का परीक्षण करना: परामर्शों का सारांश बनाना, प्रक्रियाओं को खोजना, पत्राचार का वर्गीकरण, FAQ सहायता। कार्यान्वयनकर्ताओं के पास ही नहीं, बल्कि प्रशासन के भीतर MLOps और AI शासन क्षमताएं विकसित करना। निष्कर्ष AI संप्रभुता इस बात पर निर्भर नहीं करती कि हर देश OpenAI का अपना समकक्ष बनाएगा। यह इस बात पर निर्भर करता है कि देश जानता है कि कौन सी प्रक्रियाएं उसके नियंत्रण में रहनी चाहिए, कौन से निर्भरता स्वीकार्य हैं और कौन सा रणनीतिक जोखिम बन जाता है। राष्ट्रीय LLM महत्वपूर्ण है, लेकिन यह एक स्टैंडअलोन समाधान नहीं है। आने वाला दशक यह दिखाएगा कि कौन AI को एक और सदस्यता-आधारित एप्लिकेशन के रूप में देखेगा, और कौन इसे सरकारी बुनियादी ढांचे के रूप में। अंतर न केवल तकनीक में दिखाई देगा, बल्कि सार्वजनिक सेवाओं की गुणवत्ता, डेटा सुरक्षा, संकटों पर प्रतिक्रिया देने की क्षमता और वैश्विक पारिस्थितिकी तंत्र में स्थानीय कंपनियों की स्थिति में भी दिखाई देगा। स्रोत Linux Foundation: The State of Sovereign AI Government of Canada: AI Sovereign Compute Infrastructure Program IndiaAI Compute Portal मिनिस्ट्री ऑफ डिजिटाइजेशन: पीएलएलएम मॉडलों का परिवार बढ़ रहा है डिजिटल स्टेट यूए: यूक्रेन एक संप्रभु एआई मॉडल की ओर बढ़ रहा है BCG: एआई संप्रभुता एक भ्रम है। लचीलापन वास्तविक है McKinsey: संप्रभु एआई - रणनीतिक लचीलापन और प्रभाव के लिए पारिस्थितिकी तंत्र का निर्माण ईयू एआई एक्ट: उच्च-स्तरीय सारांश </ul