दुनिया में AI - 26 मई 2026 की सबसे महत्वपूर्ण घटनाएँ
आज का डेली एआई वर्ल्ड ब्रीफ दुनिया के प्रमुख क्षेत्रों से आर्टिफिशियल इंटेलिजेंस पर सबसे महत्वपूर्ण खबरें एकत्र करता है। फोकस व्यावसायिक कार्यान्वयन (business implementations), नियमन (regulations), सुरक्षा और एआई मॉडल के विकास पर है। यूरोप मल्टी-एजेंट सिस्टम्स और सिमेंटिक वेब से एजेंटिक एआई तक: एजेंट्स के वेब का एक एकीकृत विवरण arXiv:2507.10644v4 घोषणा प्रकार: प्रतिस्थापित सार: वेब ऑफ एजेंट्स (WoA) दस्तावेज़-केंद्रित वेब को स्वायत्त एजेंटों के वातावरण में बदल देता है जो उपयोगकर्ताओं की ओर कार्य करते हैं, यह एक ऐसा दृष्टिकोण है जो बड़े भाषा मॉडल (LLMs) के परिपक्व होने पर नया संभव हुआ है। हम तर्क देते हैं कि तीन दशकों में WoA ने कालानुक्रमिक क्रम में \emph{सिमेंटिक-प्रयास प्रवासन} से गुज़रा है: प्लेटफॉर्म-साइड समन्वय (मल्टी-एजेंट सिस्टम्स, जेनरेशन~I) से, डेटा-साइड एनोटेशन (सिमेंटिक वेब, जेनरेशन~II) तक, मॉडल-साइड व्याख्या (एलएलएम-युग, जेनरेशन~III) तक। इस प्रक्षेपवक्र के भीतर केंद्रीय Gen~II~$\rightarrow$~Gen~III संक्रमण, जिसे हम \emph{डेटा में सिमेंटिक्स $\rightarrow$ मॉडलों में सिमेंटिक्स} बदलाव कहते हैं, भविष्यसूचक है: प्रत्येक पीढ़ी के विफलता मोड और वर्तमान खुले प्रश्न उस जगह से निकलते हैं जहां उस पीढ़ी ने अपना सिमेंटिक प्रयास केंद्रित किया था। यह सर्वेक्षण पाँच योगदान देता है: (i)~एक एकीकृत विकास यह क्यों महत्वपूर्ण है: इस जानकारी के प्रभाव को बाजार, नियमन और एआई उपयोगकर्ताओं पर देखना उपयोगी है। स्रोत: arXiv AI (26.05.2026) जब एआई मॉडल में डेटा पॉइज़निंग एक सुरक्षा चुनौती बन जाती है - टेबल.ब्रीफिंग्स जब एआई मॉडल में डेटा पॉइज़निंग एक सुरक्षा चुनौती बन जाती है टेबल.ब्रीफिंग्स यह क्यों महत्वपूर्ण है: बाज़ार, नियमन और एआई उपयोगकर्ताओं पर इस जानकारी के प्रभाव का अवलोकन करना उपयोगी है। स्रोत: Google News AI Europe (26.05.2026) न्यायाधीशों का न्याय कौन करता है?
मेट्रिक्स से शासन: निरंतर एलएलएम अनुपालन निगरानी के लिए एक रनटाइम फ्रेमवर्क arXiv:2605.24737v1 घोषणा प्रकार: क्रॉस सार: एआई अनुपालन के वर्तमान दृष्टिकोण अनुरूपता को उत्पादन प्रणालियों के निरंतर, मापने योग्य गुण के बजाय एक द्विआधारी, ऑडिट-समय निर्णय मानते हैं। हम तर्क देते हैं कि यह अनुपालन कल्पना संरचनात्मक रूप से यूरोपीय संघ के एआई अधिनियम की आवश्यकताओं के लिए अनुपयुक्त है, जिसमें चल रहे मानव निरीक्षण और तैनात प्रणालियों में उभरते व्यवहारिक विचलन का पता लगाना आवश्यक है। हम 'मेट्रिक्स से शासन' (governance from metrics) प्रस्तुत करते हैं, एक सिद्धांत जिसके द्वारा नियामक अनुपालन को स्थिर मूल्यांकन के बजाय रनटाइम ऑब्जर्वेबिलिटी से एक निरंतर संकेत के रूप में प्राप्त किया जाता है। इस सिद्धांत पर निर्माण करते हुए, हम govllm प्रस्तुत करते हैं, जो एक ओपन-सोर्स फ्रेमवर्क है जो एक शासन-संचालित रूटिंग आर्किटेक्चर लागू करता है जिसमें मॉडल का चयन केवल विलंबता या लागत द्वारा नहीं बल्कि संचित अनुपालन स्कोर द्वारा निर्धारित होता है। हमारे दृष्टिकोण के केंद्र में नियामक न्यायाधीशों का एक पैनल - एलएलएम मूल्यांकनकर्ता हैं यह क्यों महत्वपूर्ण है: बाज़ार, नियमन और एआई उपयोगकर्ताओं पर इस जानकारी के प्रभाव का अवलोकन करना उपयोगी है। स्रोत: arXiv AI (26.05.2026) Infosecurity Europe 2024 Key Findings: AI-Driven Cyber Threats, MFA Bypass, and Supply Chain Vulnerabilities Impacting Microsoft 365, Google Workspace, and Okta - Rescana Infosecurity Europe 2024 Key Findings: AI-Driven Cyber Threats, MFA Bypass, and Supply Chain Vulnerabilities Impacting Microsoft 365, Google Workspace, and Okta Rescana यह क्यों महत्वपूर्ण है: इस जानकारी के प्रभाव को बाज़ार, नियमों और एआई उपयोगकर्ताओं पर देखना उपयोगी है। स्रोत: Google News AI Europe (26.05.2026) उत्तरी अमेरिका Towards trustworthy agentic AI: a comprehensive survey of safety, robustness, privacy, and system security arXiv:2605.23989v1 Announce Type: new Abstract: Agentic AI systems -- Large Language Models (LLMs) augmented with planning, tool use, memory, and long-horizon interactions -- can execute complex tasks autonomously, but their multi-step trajectories introduce new failure modes that challenge trustworthiness.
This survey provides a focused examination of trustworthy agentic AI through two core dimensions that are critical for high-risk deployments: Safety and Robustness, and Privacy and System Security.
For each dimension, we clarify key concepts, identify where risks emerge along the agent workflow, and summarize stage-targeted mitigation strategies.
Other trustworthiness aspects (value alignment, transparency, fairness, and accountability) are discussed as relevant context rather than parallel chapters.
To support consistent comparison and deployment decisions, we consolidate evaluation यह क्यों महत्वपूर्ण है: बाजार, नियमों और एआई उपयोगकर्ताओं पर इस जानकारी के प्रभाव को देखना उपयोगी होगा। स्रोत: arXiv AI (26.05.2026) GlobalDentBench: विशेषज्ञ अंशांकन के साथ दंत चिकित्सा में एलएलएम नैदानिक तर्क का मूल्यांकन करने के लिए एक बहुराष्ट्रीय बेंचमार्क arXiv:2605.24636v1 Announce Type: new Abstract: जबकि बड़े भाषा मॉडल (LLMs) में चिकित्सा के लिए परिवर्तनकारी क्षमता है, वास्तविक दुनिया के नैदानिक परिदृश्यों में उनका तर्क की मजबूती और सुरक्षा अभी भी गंभीर रूप से कम खोजे गए हैं, विशेष रूप से दंत चिकित्सा में। यहां हम ग्लोबलडेंटबेंच (GlobalDentBench) प्रस्तुत करते हैं, जो पहला बहुराष्ट्रीय डेंटल बेंचमार्क है, जिसमें एक ऐसा वर्गीकरण शामिल है जो छह महाद्वीपों तक फैले 88 देशों और क्षेत्रों में 14 डेंटल विशेषज्ञताओं को समाहित करता है। यह बेंचमार्क तीन प्रारूपों (बहुविकल्पीय, लघु-उत्तर, और केस-आधारित प्रश्न) में 8,978 विशेषज्ञ-सत्यापित प्रश्नों का समावेश करता है और तीन प्रगतिशील तर्क स्तरों का आकलन करता है: ज्ञान स्मरण (L1), नियमित तर्क (L2), और व्यक्तिगत तर्क (L3)। डेटा की गुणवत्ता सुनिश्चित करने के लिए, स्वचालित निर्माण फ्रेमवर्क को छह वरिष्ठ दंत चिकित्सकों द्वारा कैलिब्रेट किया गया था, जिससे बहुविकल्पीय और लघु-उत्तर प्रश्नों के लिए 99.98% विशेषज्ञ सहमति दर प्राप्त हुई यह क्यों महत्वपूर्ण है: बाजार, नियमों और एआई उपयोगकर्ताओं पर इस जानकारी के प्रभाव को देखना उपयोगी होगा। स्रोत: arXiv AI (26.05.2026) एमडीआईए: हेल्थबेंच प्रोफेशनल पर एक मल्टी-एजेंट डायग्नोस्टिक इंटेलिजेंस पाइपलाइन arXiv:2605.24699v1 Announce Type: new Abstract: Most reported gains on agentic-LLM clinical benchmarks are often attributed to prompt engineering, yet our results suggest that larger improvements can come from architectural and engine-level design.
We present MDIA, a Multi-agent Diagnostic Intelligence Agent implemented as a 7-node specialty-routed clinical reasoning graph, on the full HealthBench Professional benchmark (n = 525), on a non-fine-tuned LLM.
MDIA achieves 0.6272 under OpenAI's GPT-5.4-2026-03-05, which is +3.72 pp above the performance of OpenAI's ChatGPT for Clinicians.