दुनिया में AI - 27 मई, 2026 की सबसे महत्वपूर्ण घटनाएँ

आज का Daily AI World Brief दुनिया के प्रमुख क्षेत्रों से कृत्रिम बुद्धिमत्ता (artificial intelligence) पर सबसे महत्वपूर्ण समाचार एकत्र करता है। ध्यान व्यावसायिक कार्यान्वयन, नियमन, सुरक्षा और एआई मॉडल के विकास पर केंद्रित है। यूरोप एआई सेफ्टी रिसर्चर सहार अब्देलनाबी ने जर्मनी में 4 पीएचडी और रिसर्च पद खोले (पूरी तरह से वित्त पोषित) - ग्लोबल साउथ के अवसर एआई सेफ्टी रिसर्चर सहार अब्देलनाबी ने जर्मनी में 4 पीएचडी और रिसर्च पद खोले (पूरी तरह से वित्त पोषित) ग्लोबल साउथ के अवसर यह क्यों महत्वपूर्ण है: बाजार, नियमन और एआई उपयोगकर्ताओं पर इस जानकारी के प्रभाव को देखना उपयोगी होगा। स्रोत: Google News AI Europe (27.05.2026) एसीआई यूरोप ने एकीकृत साइबर सुरक्षा रणनीति का आह्वान किया क्योंकि उन्नत एआई खतरे की क्षमताएं विमानन आपूर्ति श्रृंखलाओं और क्लाउड पारिस्थितिक तंत्रों में प्रणालीगत जोखिम बढ़ाती हैं - ट्रैवल एंड टूर वर्ल्ड एसीआई यूरोप ने एकीकृत साइबर सुरक्षा रणनीति का आह्वान किया क्योंकि उन्नत एआई खतरे की क्षमताएं विमानन आपूर्ति श्रृंखलाओं और क्लाउड पारिस्थितिक तंत्रों में प्रणालीगत जोखिम बढ़ाती हैं ट्रैवल एंड टूर वर्ल्ड यह क्यों महत्वपूर्ण है: बाजार, नियमन और एआई उपयोगकर्ताओं पर इस जानकारी के प्रभाव को देखना उपयोगी होगा। स्रोत: Google News AI Europe (27.05.2026) AI स्टॉक मोमेंटम वैश्विक अशांति के बीच यूरोप को स्थिर रखता है - Kalkine Media AI स्टॉक मोमेंटम वैश्विक अशांति के बीच यूरोप को स्थिर रखता है Kalkine Media इसका क्या महत्व है: इस जानकारी के प्रभाव को बाजार, नियमों और एआई उपयोगकर्ताओं पर देखना उपयोगी है। स्रोत: Google News AI Europe (27.05.2026) स्वास्थ्य में एआई: भविष्य को आकार देना - CEPS स्वास्थ्य में एआई: भविष्य को आकार देना CEPS इसका क्या महत्व है: इस जानकारी के प्रभाव को बाजार, नियमों और एआई उपयोगकर्ताओं पर देखना उपयोगी है। स्रोत: Google News AI Europe (27.05.2026) उत्तरी अमेरिका त्रुटि मुक्त ईएचआर की ओर: इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड में नैदानिक नोट्स और संरचित तालिकाओं के बीच तर्क-गहन स्थिरता सत्यापन arXiv:2605.26463v1 Announce Type: cross Abstract: इलेक्ट्रॉनिक हेल्थ रिकॉर्ड्स (EHRs) में अनस्ट्रक्चर्ड क्लिनिकल नोट्स और स्ट्रक्चर्ड टेबल्स के बीच डेटा स्थिरता रोगी सुरक्षा और नैदानिक निर्णय लेने के लिए आवश्यक है। हालांकि, नोट-टेबल स्थिरता सत्यापन पर मौजूदा कार्य मुख्य रूप से संख्यात्मक मानों या साधारण घटनाओं की सतह-स्तर मिलान पर निर्भर करता है। ऐसे दृष्टिकोण वास्तविक दुनिया के EHR दस्तावेज़ीकरण में अंतर्निहित तर्क को कैप्चर करने में विफल रहते हैं, जिसमें नैदानिक व्याख्या, घटना संबंध और अस्थायी परिवर्तन शामिल हैं। इस अंतर को दूर करने के लिए, हम EHR-ReasonCon प्रस्तुत करते हैं, जो नोट-टेबल स्थिरता सत्यापन के लिए एक रीजनिंग-इंटेन्सिव बेंचमार्क है। विशेषज्ञ-निर्देशित एनोटेशन के साथ MIMIC-III पर निर्मित, इसमें क्लिनिकल नोट्स से प्राप्त 8,048 संस्थाएं शामिल हैं और उच्च-गुणवत्ता वाले ग्राउंड-ट्रुथ लेबल प्रदान करता है। एनोटेशन प्रोटोकॉल को व्यवस्थित evide सुनिश्चित करने के लिए विशेष टेबल-एक्सप्लोरेशन टूल द्वारा समर्थित किया गया है यह क्यों महत्वपूर्ण है: इस जानकारी का बाजार, नियमों और एआई उपयोगकर्ताओं पर पड़ने वाले प्रभाव का अवलोकन करना उपयोगी है। स्रोत: arXiv AI (27.05.2026) भाषा मॉडल के लिए गतिशील सीमा मूल्यांकन: निश्चित बेंचमार्क और सबसे खराब स्थिति वाले हमलों से परे arXiv:2605.06213v2 Announce Type: replace Abstract: आज बड़े भाषा मॉडल (LLMs) का मूल्यांकन निश्चित बेंचमार्क पर निर्भर करता है जो किसी भी मॉडल पर वस्तुओं का एक ही सेट लागू करते हैं, जिससे छत और फर्श प्रभाव उत्पन्न होते हैं जो क्षमता अंतराल को छिपाते हैं। हम तर्क देते हैं कि सबसे जानकारीपूर्ण मूल्यांकन संकेत सीमा पर स्थित होता है, जहां रैंडम-सैंपलिंग डीकोडिंग के तहत प्रति-प्रॉम्प्ट पास संभावना $0.5$ के करीब होती है, और डायनेमिक बाउंड्री इवैल्यूएशन (DBE) प्रस्तावित करते हैं, जो सक्रिय रूप से प्रत्येक मॉडल की सीमा का पता लगाता है और इसे एक वैश्विक स्तर पर तुलनीय कठिनाई पैमाने पर रखता है। DBE तीन कलाकृतियाँ प्रदान करता है: (i) एक कैलिब्रेटेड आइटम बैंक जो सुरक्षा, क्षमता और सत्यनिष्ठा को कवर करता है, जिसमें $9$ संदर्भ LLMs में मान्य प्रति-आइटम कठिनाई लेबल हैं; (ii) स्किल-गाइडेड बाउंड्री सर्च (SGBS), एक खोज एल्गोरिथम जो केवल एपीआई-स्तर के क्वेरी एक्सेस का उपयोग करके दिए गए लक्ष्य LLM के लिए सीमा आइटम ढूंढता है; और (iii) एक मूल्यांकन प्रोटोकॉल जो प्ल यह क्यों महत्वपूर्ण है: इस जानकारी के प्रभाव को बाजार, नियमों और एआई उपयोगकर्ताओं पर देखना उपयोगी है। स्रोत: arXiv AI (27.05.2026) ग्लोबल्डेंटबेंच: विशेषज्ञ अंशांकन के साथ दंत चिकित्सा में एलएलएम नैदानिक तर्क का मूल्यांकन करने के लिए एक बहुराष्ट्रीय बेंचमार्क arXiv:2605.24636v2 Announce Type: replace Abstract: जबकि बड़े भाषा मॉडल (LLMs) चिकित्सा के लिए परिवर्तनकारी क्षमता रखते हैं, वास्तविक दुनिया के नैदानिक परिदृश्यों में उनकी तर्क शक्ति और सुरक्षा अभी भी गंभीर रूप से कम खोजे गए हैं, खासकर दंत चिकित्सा में। यहां हम GlobalDentBench प्रस्तुत करते हैं, जो पहला बहुराष्ट्रीय डेंटल बेंचमार्क है, जिसमें एक टैक्सोनॉमी शामिल है जो छह महाद्वीपों तक फैले 88 देशों और क्षेत्रों में 14 डेंटल विशेषज्ञताओं को समाहित करती है। यह बेंचमार्क तीन प्रारूपों (बहुविकल्पीय, लघु-उत्तर, और केस-आधारित प्रश्न) में 8,978 विशेषज्ञ-मान्य प्रश्नों का समावेश करता है और तीन प्रगतिशील तर्क स्तरों का आकलन करता है: ज्ञान स्मरण (L1), नियमित तर्क (L2), और व्यक्तिगत तर्क (L3)। डेटा की गुणवत्ता सुनिश्चित करने के लिए, स्वचालित निर्माण ढांचे को छह वरिष्ठ दंत चिकित्सकों द्वारा कैलिब्रेट किया गया था, जिससे बहुविकल्पीय और लघु-उत्तर के लिए 99.98% विशेषज्ञ सहमति दर प्राप्त हुई। यह क्यों महत्वपूर्ण है: बाजार, नियमों और एआई उपयोगकर्ताओं पर इस जानकारी के प्रभाव को देखना उपयोगी है। स्रोत: arXiv AI (27.05.2026) मुझसे सुनना बंद करें!

मल्टी-टर्न बातचीत कैसे LLM की विश्वसनीयता को कम कर सकती है arXiv:2603.11394v3 Announce Type: replace-cross Abstract: बड़े भाषा मॉडल (LLMs) स्थिर बेंचमार्क पर उत्कृष्ट प्रदर्शन करते हैं, लेकिन मल्टी-टर्न बातचीत में उनका प्रदर्शन, जो वास्तविक दुनिया के उपयोग को बेहतर ढंग से दर्शाता है, अभी भी कम अध्ययन किया गया है। इस अंतर को पाटना स्वास्थ्य सेवा जैसे उच्च जोखिम वाले सेटिंग्स में महत्वपूर्ण है, जहां मरीज और चिकित्सक अपनी चिकित्सा पूछताछ का समाधान करने के लिए LLM चैटबॉट्स की ओर रुख कर रहे हैं। यहां, हम "स्टिक-ऑर-स्विच" (SoS) फ्रेमवर्क प्रस्तुत करते हैं, जो एक प्रश्न-उत्तर स्थान को कई अनुक्रमिक प्रस्तुतियों में विभाजित करता है ताकि दो सुरक्षा-केंद्रित व्यवहारों को मॉडल किया जा सके: दृढ़ विश्वास (यानी, सही उत्तर चयन पर टिके रहना या गलत सुझावों के खिलाफ संयम बरतना) और लचीलापन (यानी, जब कोई सही सुझाव पेश किया जाता है तो उस पर स्विच करना)। तीन नैदानिक बेंचमार्क में 17 LLMs का मूल्यांकन करते हुए, हम एक व्यापक बातचीत कर टैक्स देखते हैं, जहां उत्तर-स्थान को अनुक्रमिक रूप से विभाजित करने पर यह क्यों महत्वपूर्ण है: इस जानकारी के बाजार, नियमों और एआई उपयोगकर्ताओं पर पड़ने वाले प्रभाव का अवलोकन करना उपयोगी है। स्रोत: arXiv AI (27.05.2026) एशिया Microsoft ने ग्लोबल साउथ में एआई एक्सेस का विस्तार करने के लिए 50 बिलियन डॉलर का निवेश करने, भारत में शिक्षक स्किलिंग कार्यक्रम शुरू करने की घोषणा की - DD News Microsoft ने ग्लोबल साउथ में एआई एक्सेस का विस्तार करने के लिए 50 बिलियन डॉलर का निवेश करने, भारत में शिक्षक स्किलिंग कार्यक्रम शुरू करने की घोषणा की DD News यह क्यों महत्वपूर्ण है: इस जानकारी के बाजार, नियमों और एआई उपयोगकर्ताओं पर पड़ने वाले प्रभाव का अवलोकन करना उपयोगी है। स्रोत: Google News AI South America (26.05.2026) Global companies bet on AI-powered innovation at India capability centres - News9live Global companies bet on AI-powered innovation at India capability centres News9live यह क्यों महत्वपूर्ण है: इस जानकारी के प्रभाव को बाजार, नियमों और एआई उपयोगकर्ताओं पर देखना उपयोगी है। स्रोत: Google News AI Asia (27.05.2026) India AI Impact Summit 2026 Draws World Leaders as Global AI Dialogue Takes Centre Stage - DD News India AI Impact Summit 2026 Draws World Leaders as Global AI Dialogue Takes Centre Stage DD News इसका महत्व क्यों है: बाज़ार, नियमन और एआई उपयोगकर्ताओं पर इस जानकारी के प्रभाव का अवलोकन करना महत्वपूर्ण है। स्रोत: Google News AI Europe (27.05.2026) From Detection to Recovery: Operational Analysis on LLM Pre-training with 504 GPUs arXiv:2605.09370v2 Announce Type: replace-cross Abstract: बड़े पैमाने पर एआई प्रशिक्षण अब मौलिक रूप से एक वितरित सिस्टम समस्या है, और हार्डवेयर विफलताएं दुर्लभ अपवादों के बजाय नियमित परिचालन स्थितियाँ बन गई हैं। हालांकि, उत्पादन प्रशिक्षण क्लस्टरों से सार्वजनिक परिचालन साक्ष्य अभी भी कम हैं। यह तकनीकी रिपोर्ट 63-नोड NVIDIA B200 प्रोडक्शन क्लस्टर (504 GPUs) का एक अनुभवजन्य विश्लेषण प्रस्तुत करती है, जिसमें 55 दिनों का Prometheus टाइम-सीरीज़ डेटा और 73 दिनों के परिचालन लॉग शामिल हैं जो 224 मल्टी-नोड प्रशिक्षण सत्रों को कवर करते हैं। यह क्लस्टर एक क्रॉस-संगठनात्मक वातावरण में संचालित होता है जहां पांच पक्ष (SKT, Upstage, Lablup, NVIDIA Korea, और VAST Data) एक एकीकृत निगरानी पाइपलाइन साझा करते हैं। इस व्यवस्था ने 60-नोड-स्केल स्टोरेज I/O बॉटलनेक के संयुक्त निदान को सक्षम किया जो 2-4-नोड स्केल पर दिखाई नहीं दिया था, यह उत्पादन-स्केल की घटना है जिसे कोई भी एकल टीम अलग नहीं कर सकती थी इसका महत्व क्यों है: बाज़ार, नियमन और एआई उपयोगकर्ताओं पर इस जानकारी के प्रभाव का अवलोकन करना महत्वपूर्ण है। स्रोत: arXiv AI (27.05.2026) दक्षिण अमेरिका Few-shot Cross-country Generalization of Tabular Machine Learning and Foundation Models for Childhood Anemia Prediction under Distribution Shift arXiv:2605.26589v1 Announce Type: cross Abstract: Childhood anemia affects around 40% of children aged 6-59 months globally and arises from heterogeneous factors, limiting model generalizability.

We evaluate a transformer-based tabular foundation model against classical supervised methods under cross-country and data-scarce settings.

We used DHS data from 16 countries across Africa, Asia, Latin America, the Caucasus, and the Middle East (n=68,856).

We compared Logistic Regression, XGBoost, LightGBM, and TabPFN v2.6.

Performance was assessed using AUC-ROC, Brier score, and ECE.

Generalization was evaluated using leave-one-country-out (LOCO), reverse-LOCO, and few-shot settings.

Subgroup analyses included sex, age, residence, maternal education, and wealth.