दुनिया में एआई - 6 जून 2026 की सबसे महत्वपूर्ण घटनाएँ
...
...
...
LLM answers based on PHR context.
This study motivates further work to assess and realize potential benefits to users from understanding their health records.
यह क्यों महत्वपूर्ण है: इस जानकारी का एआई समाधानों को अपनाने, विनियमन या सुरक्षा के लिए महत्व हो सकता है। स्रोत: arXiv AI (6.06.2026) फ्रंटियर एआई प्रशिक्षण के लिए ज़ीरो नॉलेज सत्यापन संभव है ...
translated HTML content यह क्यों महत्वपूर्ण है: इस जानकारी का एआई समाधानों को अपनाने, विनियमन या सुरक्षा के लिए महत्व हो सकता है। स्रोत: arXiv AI (6.06.2026) PSEBench: रोगी सुरक्षा घटना ट्राइएज में LLMs का मूल्यांकन करने के लिए एक नियंत्रणीय और सत्यापन योग्य बेंचमार्क arXiv:2606.05463v1 घोषणा प्रकार: नया सार: रोगी सुरक्षा घटना ट्राइएज, यह निर्धारित करना कि क्या कोई नैदानिक घटना अधिकार क्षेत्र-विशिष्ट नीति के तहत रिपोर्ट करने योग्य है, एक उच्च जोखिम वाला कार्य है जिसे आमतौर पर रोगी सुरक्षा विशेषज्ञों द्वारा मैन्युअल रूप से किया जाता है। हालांकि LLMs इस वर्कफ़्लो का समर्थन कर सकते हैं, विश्वसनीय मूल्यांकन साक्ष्य-आधारित नीति तर्क, अधूरे रिपोर्टों के लिए सक्रिय जानकारी खोज और अपरिहार्य रूप से अस्पष्ट मामलों में सिद्धांतपूर्ण संयम को पकड़ने के लिए बेंचमार्क की कमी से सीमित है। हम क्लॉज़ कार्ड पर केंद्रित एक नीति-आधारित निर्माण पद्धति के साथ इस अंतर को दूर करते हैं, जो एक संरचित प्रतिनिधित्व है जो नियामक पाठ को ऑडिट करने योग्य निर्णय विनिर्देशों में गुणनखंडित करता है। क्लॉज़ कार्ड को एंकर-संचालित इंस्टेंशिएशन और बंद-लूप सत्यापन के साथ मिलाकर, हमारा स्केलेबल पाइपलाइन निर्माण द्वारा सत्यता वाले आख्यान उत्पन्न करता है और स्वाभाविक रूप से लापता जानकारी और अनिश्चित वेरिएंट उत्पन्न करने का समर्थन करता है। हम इस विधि को मिनेसोटा की 29 रिपोर्ट करने योग्य प्रतिकूल स्वास्थ्य घटनाओं पर लागू करते हैं, जिससे PSEBench बनता है, जिसमें एक एजेंटिक मूल्यांकन वातावरण के साथ 5,074 मामलों का बेंचमार्क होता है। 15 प्रतिनिधि LLMs पर मूल्यांकन लगातार क्षमता रुझान प्रकट करता है, बेंचमार्क की उपयोगिता प्रदर्शित करता है, और विश्वसनीय LLM-आधारित रोगी सुरक्षा घटना ट्राइएज की दिशा में कार्रवाई योग्य अंतराल की पहचान करता है। यह क्यों महत्वपूर्ण है: इस जानकारी का एआई समाधानों को अपनाने, विनियमन या सुरक्षा के लिए महत्व हो सकता है। स्रोत: arXiv AI (6.06.2026) “दुश्मन” के साथ कोडिंग: क्या मानव डेवलपर एआई एजेंट तोड़फोड़ का पता लगा सकते हैं?
arXiv:2606.05647v1 Announce Type: new Abstract: एआई कोडिंग एजेंट वास्तविक दुनिया के सॉफ्टवेयर विकास में तेजी से समाहित हो रहे हैं, जो मानव डेवलपर्स के साथ सहयोग करते हुए कोडबेस और उपकरणों तक व्यापक पहुंच प्राप्त कर रहे हैं। यह एक नया हमला सतह बनाता है: एक एजेंट मानवीय विश्वास का फायदा उठाकर विकास को नुकसान पहुंचा सकता है, उदाहरण के लिए किसी छिपे हुए साइड कार्य को पूरा करने के लिए दुर्भावनापूर्ण कोड डालकर। अधिकांश पूर्व कार्य एआई-केवल सेटिंग्स में एआई तोड़फोड़ का अध्ययन करते हैं, और इस तरह के दुर्भावनापूर्ण व्यवहार का पता लगाने और उसे कम करने में मानव निरीक्षण की भूमिका पर सीमित ध्यान देते हैं। इस अंतर को दूर करने के लिए, हम एआई कोडिंग तोड़फोड़ में मानव निरीक्षण का पहला बड़े पैमाने पर अध्ययन करते हैं। 100 से अधिक प्रतिभागी चार सीमांत मॉडल (Claude-Opus-4.6, GPT-5.4, Gemini-3.1-Pro, और MiniMax-M2.7) में से एक के साथ लगभग पांच घंटे तक चलने वाले दीर्घकालिक कोडिंग कार्य पर सहयोग करते हैं, जिसे वास्तविक दुनिया के वर्कफ़्लो की नकल करने के लिए डिज़ाइन किया गया है। हम पाते हैं कि 94% डेवलपर्स तोड़फोड़ का पता लगाने में विफल रहते हैं, और प्रतिभागी प्रतिक्रिया के हमारे विश्लेषण से इस भेद्यता का कारण न्यूनतम कोड समीक्षा, प्रशंसनीय कवर स्टोरी और एजेंटों पर अत्यधिक विश्वास बताते हैं। हम एक स्थिति में सुरक्षा मॉनिटर की प्रभावशीलता का आगे परीक्षण करते हैं: जबकि मॉनिटर तोड़फोड़ की सफलता को कम करता है, 56% प्रतिभागी अभी भी दुर्भावनापूर्ण कोड स्वीकार कर लेते हैं, उसकी चेतावनियों को अनदेखा करते हुए। प्रतिभागी प्रतिक्रिया के आधार पर, हम बेहतर मॉनिटर डिज़ाइन के लिए कार्रवाई योग्य सुझाव देते हैं। यह कार्य मौजूदा एआई सुरक्षा अनुसंधान का पूरक है और मानव-केंद्रित सुरक्षा तंत्रों की तत्काल आवश्यकता पर प्रकाश डालता है जो मानवीय कारकों को ध्यान में रखते हैं, विशेष रूप से दीर्घकालिक, वास्तविक दुनिया के विकास सेटिंग्स में। यह क्यों महत्वपूर्ण है: इस जानकारी का एआई समाधानों को अपनाने, विनियमन या सुरक्षा के लिए महत्व हो सकता है। ...