डिजिटल महाभारत: एआई के वैश्विक मानचित्र पर भारतीय एलएलएम

भारतीय LLM अब केवल एक वादा नहीं हैं। Sarvam AI, IndiaAI Mission, AI4Bharat और अन्य टीमें एक ऐसे देश के लिए स्थानीय आर्टिफिशियल इंटेलिजेंस की परत बना रही हैं जहाँ भाषा, आवाज़ और सार्वजनिक सेवाओं तक पहुँच अंग्रेजी बेंचमार्क पर रैंकिंग जितनी ही महत्वपूर्ण है। संलग्न HTML रिपोर्ट को एक सुरक्षित React/Recharts कंपोनेंट में स्थानांतरित किया गया है क्योंकि पोर्टल लेख सामग्री में बाहरी Chart.js स्क्रिप्ट या CDN कोड नहीं चलाता है। प्रकाशित संस्करण इन्फोग्राफिक की प्रकृति को बनाए रखता है, लेकिन संख्याओं को स्रोतों के अनुसार व्यवस्थित करता है: आधिकारिक PIB संचार, Sarvam AI सामग्री, AI4Bharat रिपॉजिटरी, Stanford HAI रिपोर्ट और BCG विश्लेषण। सबसे महत्वपूर्ण संदर्भ सरल है: भारत को एक मूल्यवान AI रणनीति बनाने के लिए तुरंत OpenAI, Anthropic या DeepSeek को फ़्रंटियर मॉडल में हराने की ज़रूरत नहीं है। उनकी सबसे बड़ी समस्या स्थानीय और साथ ही विशाल भी है: कई भाषाओं, लिपियों, बोलियों, वॉयस चैनलों और प्रशासनिक प्रक्रियाओं को संभालना। इस अर्थ में, भारतीय LLM "भारतीय ChatGPT" से कम हैं, और राष्ट्रीय भाषाई बुनियादी ढाँचा बनाने के प्रयास से अधिक हैं। IndiaAI Mission को मार्च 2024 में 10,300 करोड़ रुपये से अधिक के बजट के साथ अनुमोदित किया गया था। PIB इस कार्यक्रम का वर्णन सात घटकों के एक सेट के रूप में करता है: कंप्यूट, नवाचार केंद्र, डेटा प्लेटफॉर्म, एप्लिकेशन, क्षमताएं, स्टार्टअप फंडिंग और Safe & Trusted AI। जुलाई 2025 में, PIB ने बताया कि IndiaAI Compute Portal राज्य समर्थन के बाद प्रति GPU-घंटे लगभग 67 रुपये की औसत कीमत पर 34,381 GPU प्रदान करता है। यह स्टार्टअप्स के लिए एक विशिष्ट लाभ है जिन्हें अन्यथा बड़े प्रशिक्षण तक पहुँच नहीं मिल पाती होगी। सबसे प्रमुख व्यावसायिक खिलाड़ी Sarvam AI है। कंपनी ने Sarvam 30B और 105B को भारत में शुरू से प्रशिक्षित रीजनिंग मॉडल के रूप में वर्णित किया है, जिसमें भारतीय भाषाओं, कोड, गणित और एजेंट वर्कफ़्लो पर ज़ोर दिया गया है। Sarvam की ब्लॉग पोस्ट के अनुसार, 105B मॉडल AIME 25, LiveCodeBench v6, MMLU Pro, BrowseComp और Tau2 जैसे चयनित बेंचमार्क में मजबूत परिणाम प्राप्त करता है। ये संख्याएँ महत्वपूर्ण हैं, लेकिन सावधानी बरतने की आवश्यकता है: ये मॉडल निर्माता द्वारा प्रदान की गई हैं, इसलिए पेशेवर कार्यान्वयन को अपनी स्वयं की परीक्षणों और स्वतंत्र मूल्यांकन के माध्यम से पुष्टि करनी चाहिए। इसके समानांतर एक संस्थागत और अकादमिक परत भी विकसित हो रही है। PIB ने Sarvam AI, Soket AI, Gnani AI और Gan AI को फाउंडेशन मॉडल के रूप में चयनित टीमों के रूप में सूचीबद्ध किया है। दूसरी ओर, AI4Bharat भारतीय भाषाओं के लिए खुले NLP टूल विकसित कर रहा है, जिसमें भारत की 22 योजनाबद्ध भाषाओं के लिए IndicTrans2 शामिल है। यह पारिस्थितिकी तंत्र का कम ग्लैमरस लेकिन अनुवाद, स्पीच रिकग्निशन, स्पीच सिंथेसिस, OCR और डेटासेट के लिए मौलिक हिस्सा है। एक निष्पक्ष मूल्यांकन में कमजोरियों को भी शामिल करना होगा: अमेरिका और चीन की तुलना में कम निजी पूंजी, GPU की उपलब्धता पर निर्भरता, भाषाई विखंडन (fragmentation), नियामक जोखिम और सार्वजनिक सेवाओं में उपयोग किए जाने वाले मॉडलों का ऑडिट करने की आवश्यकता। Stanford HAI इंगित करता है कि 2024 में अमेरिका में AI में निजी निवेश $109.1 बिलियन था, जो चीन और यूनाइटेड किंगडम की तुलना में कई गुना अधिक है। इसलिए भारत वित्तीय रूप से सममित दौड़ के बजाय स्थानीय बुनियादी ढांचे की रणनीति पर निर्भर करता है। निष्कर्ष: भारतीय LLM को संप्रभु AI (sovereign AI) के सबसे दिलचस्प प्रयोगों में से एक माना जाना चाहिए। यदि Sarvam, Soket, AI4Bharat और IndiaAI गति बनाए रखते हैं, तो भारत 2027 तक बहुभाषी देशों के लिए एक मॉडल बना सकता है: अमेरिकी फ्रंटियर से छोटे, लेकिन स्थानीय भाषाओं, सार्वजनिक सेवाओं और नागरिकों की वास्तविक ज़रूरतों में अधिक गहराई से निहित मॉडल। स्रोत Sarvam AI: Open-Sourcing Sarvam 30B and 105B पीआईबी: कैबिनेट ने इंडियाएआई मिशन के लिए 10,300 करोड़ रुपये से अधिक को मंजूरी दी पीआईबी: भारत एआई इम्पैक्ट समिट और फाउंडेशन मॉडल अपडेट्स की मेजबानी करेगा AI4Bharat/IndicTrans2 Stanford HAI: 2025 AI Index Report BCG: Global AI Race