आईआईटी प्रोफेसर लिखते हैं| प्रौद्योगिकी समाचार

Spread the love

आर्टिफिशियल इंटेलिजेंस (एआई) में विश्वास और सुरक्षा मौलिक रूप से अलग-अलग ढांचे हैं जो अक्सर विपरीत डिजाइन निर्णय, मूल्यांकन विधियों और वास्तुशिल्प विकल्पों का उत्पादन करते हैं।

एआई डिज़ाइन के समान आयामों को पूरी तरह से अलग तरीके से समझा और कार्यान्वित किया जाता है, यह इस बात पर निर्भर करता है कि व्यापक लक्ष्य सुरक्षा है या विश्वास। (छवि: अनप्लैश)

सुरक्षा मुख्य रूप से आंतरिक तकनीकी नियंत्रण और सुरक्षा उपायों के माध्यम से एआई प्रणाली से सीधे तौर पर होने वाले नुकसान को रोकने पर केंद्रित है। यह पूछता है: क्या मॉडल सटीक भविष्यवाणियां करता है? क्या यह प्रतिकूल हमलों का विरोध करता है? क्या डेटा और बुनियादी ढाँचा बाहरी खतरों से सुरक्षित हैं? सुरक्षा काफी हद तक एक आंतरिक संपत्ति है, जिसे नियंत्रित परीक्षण वातावरण और तकनीकी बेंचमार्क के माध्यम से मापा जा सकता है।

इसके विपरीत, ट्रस्ट एक अधिक समावेशी अवधारणा है जो पूरे बोर्ड में निष्पक्षता, व्याख्यात्मकता, गोपनीयता, मजबूती, शासन और सामाजिक प्रभाव को शामिल करती है।

एक प्रणाली तकनीकी रूप से सुरक्षित हो सकती है फिर भी अत्यधिक अविश्वसनीय हो सकती है, और इसके विपरीत, आंतरिक सुरक्षा सत्यापन बाहरी हितधारकों को न्यूनतम आश्वासन प्रदान करता है।

महान वैचारिक विभाजन

यह अंतर मायने रखता है क्योंकि आंतरिक बेंचमार्क और तकनीकी सुरक्षा मानकों को संतुष्ट करना आवश्यक है लेकिन विश्वास बनाने के लिए अपर्याप्त है। संगठन ऐसे सिस्टम बना सकते हैं जो सभी सुरक्षा परीक्षणों को पास करते हैं, रखे गए डेटा पर उच्च सटीकता प्राप्त करते हैं और मजबूत बुनियादी ढांचे को लागू करते हैं, फिर भी ऐसे उपकरण तैनात करते हैं जो कुछ आबादी को व्यवस्थित रूप से नुकसान पहुंचा सकते हैं या ऐसे निर्णय ले सकते हैं जिन्हें उपयोगकर्ता समझ या सत्यापित नहीं कर सकते हैं।

एआई डिज़ाइन के समान आयाम – व्याख्यात्मकता, प्रदर्शन, निष्पक्षता, गोपनीयता और मजबूती – को पूरी तरह से अलग तरीके से समझा और कार्यान्वित किया जाता है, यह इस बात पर निर्भर करता है कि व्यापक लक्ष्य सुरक्षा है या विश्वास।

1. व्याख्यात्मकता (डिबगिंग बनाम समझ)

सुरक्षा प्रतिमान में, व्याख्यात्मकता मुख्य रूप से एक इंजीनियरिंग उपकरण है; डेवलपर्स विफलताओं को डीबग करने, निर्णय सीमा में कमजोर बिंदुओं की पहचान करने और सिस्टम कहां टूटता है इसका निदान करने के लिए मॉडल भविष्यवाणियों के लिए स्पष्टीकरण उत्पन्न करते हैं।

जबकि, विश्वास प्रतिमान में, स्पष्टीकरण मौलिक रूप से भिन्न उद्देश्य की पूर्ति करते हैं। वे अंतिम-उपयोगकर्ताओं और डोमेन विशेषज्ञों को उनकी अपनी वैचारिक भाषा में निर्णयों को समझने और उनकी विशेषज्ञता के विरुद्ध तर्क को सत्यापित करने में सक्षम बनाते हैं।

उदाहरण के लिए, सुरक्षा के लिए डिज़ाइन किया गया एक चिकित्सा निदान मॉडल फीचर महत्व स्कोर और ध्यान मानचित्रों के माध्यम से इंजीनियरों को खुद को समझा सकता है।

विश्वास के लिए डिज़ाइन किया गया वही मॉडल नैदानिक भाषा का उपयोग करके चिकित्सकों को समझाएगा, जिसमें इस बात पर प्रकाश डाला जाएगा कि कौन से लक्षण और परीक्षण के परिणाम ने निदान में योगदान दिया है जिससे चिकित्सक अपने चिकित्सा ज्ञान के विरुद्ध सत्यापन कर सकते हैं। ये एक जैसी व्याख्याएं नहीं हैं क्योंकि ये अलग-अलग दर्शकों और अलग-अलग उद्देश्यों को दर्शाती हैं।

2. प्रदर्शन और बेंचमार्क (आंतरिक परीक्षण बनाम सत्यापन योग्य प्रमाण)

सुरक्षा प्रदर्शन को आंतरिक रूप से मान्य चीज़ के रूप में मानती है। क्या मॉडल परीक्षण सेट पर 95% सटीकता प्राप्त करता है? क्या यह प्रयोगशाला सेटिंग में प्रतिकूल हमलों का सामना करता है?

ये नियंत्रित बेंचमार्किंग के माध्यम से उत्तर दिए गए इंजीनियरिंग प्रश्न हैं।

हालाँकि, विश्वास के लिए बाहरी सत्यापन और सत्यापन योग्य प्रमाण की आवश्यकता होती है।

एआई को भरोसेमंद बनाने के लिए, यह तीसरे पक्ष के सत्यापन की मांग करता है: स्वतंत्र लेखा परीक्षक, अधिमानतः विश्वसनीय निष्पादन वातावरण जैसे गोपनीयता-संरक्षण तंत्र के माध्यम से मालिकाना मॉडल तक पहुंच के साथ, जो प्रदर्शन और पूर्वाग्रह विशेषताओं को प्रमाणित करते हैं।

ईयू एआई अधिनियम और उभरते नियामक ढांचे को स्पष्ट रूप से इस अंतर की आवश्यकता है।

3. निष्पक्षता और पूर्वाग्रह (भेदभाव बनाम समानता)

सुरक्षा-उन्मुख निष्पक्षता प्रणाली को निर्णय लेने में संरक्षित विशेषताओं (जाति, लिंग, आयु) का स्पष्ट रूप से उपयोग करने से रोकने पर केंद्रित है।

इससे ऐसे डिज़ाइन बनते हैं जो संवेदनशील विशेषताओं को बाहर करते हैं या “अनजानता के माध्यम से निष्पक्षता” को लागू करते हैं – यह धारणा कि जनसांख्यिकीय डेटा को हटाने से भेदभावपूर्ण परिणामों को रोका जा सकेगा।

यह दृष्टिकोण बार-बार विफल हो जाता है क्योंकि एल्गोरिदम प्रॉक्सी वेरिएबल्स का पता लगा सकते हैं जो संरक्षित विशेषताओं को एन्कोड करते हैं – एक लिंग-अंधा क्रेडिट स्कोरिंग प्रणाली महिलाओं के खिलाफ भेदभाव कर सकती है यदि मॉडल को पता चलता है कि कुछ फोन प्रकार या ऐप विकल्प महिला पहचान से संबंधित हैं, भले ही लिंग को इनपुट से बाहर रखा गया हो।

एल्गोरिथम का अनुकूलन उद्देश्य – ऋण डिफ़ॉल्ट की भविष्यवाणी करना – डेवलपर के इरादों के प्रति अज्ञेयवादी है; यदि प्रशिक्षण डेटा में ऐतिहासिक लिंग पूर्वाग्रह शामिल है, तो मॉडल उस पैटर्न के लिए शॉर्टकट ढूंढेगा। विश्वास-उन्मुख निष्पक्षता जनसांख्यिकीय समूहों में निरंतर ऑडिटिंग, प्रत्यक्ष और अप्रत्यक्ष दोनों तरह के भेदभाव के लिए परीक्षण और उस प्रदर्शन को समान रूप से सामान्यीकृत करने की पुष्टि करके इसे संबोधित करती है।

4. गोपनीयता (डेटा सुरक्षा बनाम उपयोगकर्ता नियंत्रण)

सुरक्षा-उन्मुख गोपनीयता डेटा को अनधिकृत पहुंच से बचाने पर जोर देती है: एन्क्रिप्शन, पहुंच नियंत्रण, सुरक्षित भंडारण और डेटा उल्लंघनों को रोकना। फोकस गोपनीयता पर है – यह सुनिश्चित करना कि कोई भी व्यक्तिगत जानकारी तक पहुंच या उसका दुरुपयोग नहीं कर सके।

उपयोगकर्ता एजेंसी और सूचित सहमति पर विश्वास-उन्मुख गोपनीयता केंद्र: क्या उपयोगकर्ताओं को पता है कि कौन सा डेटा एकत्र किया जा रहा है और क्यों? इसका उपयोग कैसे किया जाता है? क्या वे अपनी जानकारी तक पहुंच सकते हैं, सुधार कर सकते हैं या हटा सकते हैं? क्या संग्रहित चीज़ों के बारे में उनके पास कोई सार्थक विकल्प है?

ट्रस्ट प्रतिमान में डिज़ाइन के अनुसार गोपनीयता का अर्थ है डेटा संग्रह को कम करना, प्रत्येक उपयोग के लिए स्पष्ट सहमति प्राप्त करना, पारदर्शी डेटा-हैंडलिंग प्रथाओं को लागू करना और तकनीकी व्यवहार्यता की परवाह किए बिना उपयोगकर्ता के अधिकारों का सम्मान करना।

5. मजबूती

सुरक्षा-उन्मुख मजबूती प्रतिकूल हमलों पर केंद्रित है। उदाहरण के लिए, प्रतिकूल हमलों के खिलाफ मजबूत एक दृष्टि प्रणाली गलत वर्गीकरण के लिए हमलावरों द्वारा डिजाइन की गई छोटी गड़बड़ी का सामना कर सकती है।

विश्वास-उन्मुख मजबूती पूछती है कि क्या सिस्टम वास्तविक दुनिया की स्थितियों और विविध आबादी में विश्वसनीय रूप से सामान्यीकरण करता है।

एक डायग्नोस्टिक एआई प्रणाली को प्रतिकूल उदाहरणों के खिलाफ मजबूती से प्रशिक्षित किया जा सकता है, लेकिन विभिन्न रोगी जनसांख्यिकी, उपकरण, या नैदानिक कार्यप्रवाह के साथ एक अलग अस्पताल में तैनात किए जाने पर यह चुपचाप विफल हो जाता है।

हालिया शोध इस अंतर को स्पष्ट रूप से दर्शाता है: एक प्रकार की गड़बड़ी (उदाहरण के लिए, विशिष्ट छवि विकृतियों) के खिलाफ मजबूत होने के लिए प्रतिकूल रूप से प्रशिक्षित मॉडल अक्सर अन्य, अप्रत्याशित गड़बड़ी के प्रति कम मजबूत हो जाते हैं।

6. नैतिकता और जवाबदेही

सुरक्षा नैतिकता को अनुपालन के रूप में परिभाषित करती है: क्या सिस्टम नैतिक दिशानिर्देशों को पूरा करता है? क्या हमने जोखिम मूल्यांकन किया है? क्या हम पूर्वाग्रह शमन रणनीतियों का दस्तावेजीकरण करते हैं? ये महत्वपूर्ण हैं लेकिन मुख्य रूप से प्रक्रिया-उन्मुख हैं।

ट्रस्ट नैतिकता को संबंधपरक अखंडता के रूप में परिभाषित करता है: क्या सिस्टम वास्तव में उन सभी समूहों के लिए निष्पक्ष है जो इसे प्रभावित करते हैं? क्या हितधारकों को लगता है कि उनके मूल्यों का सम्मान किया जाता है? जब सिस्टम नुकसान पहुंचाता है तो क्या जिम्मेदारी स्पष्ट है? क्या शासन केवल डेवलपर्स के नहीं, बल्कि प्रभावित पक्षों के हितों को प्रतिबिंबित करता है?

इसके लिए विविध हितधारकों के साथ निरंतर जुड़ाव, वास्तविक दुनिया के प्रभावों की निगरानी और नैतिक मुद्दों के उभरने पर शासन को अपनाने की आवश्यकता है।

नियुक्ति के लिए डिज़ाइन किया गया एल्गोरिदम पूर्वाग्रह-शमन तकनीकों और आंतरिक निष्पक्षता ऑडिट का दस्तावेजीकरण करके नैतिक अनुपालन का दावा कर सकता है।

यह यह प्रदर्शित करके विश्वास अर्जित करता है कि भर्ती के परिणाम जनसांख्यिकी में समान हैं, कि उम्मीदवार समझते हैं कि उनका मूल्यांकन कैसे किया जाता है, कि भर्तीकर्ता सार्थक मानवीय निर्णय बनाए रखते हैं, और कंपनी निष्पक्षता संबंधी चिंताओं के बारे में प्रतिक्रिया के आधार पर प्रणाली को समायोजित करती है।

सुरक्षा के लिए एआई को डिजाइन करना कठोर आंतरिक परीक्षण, प्रतिकूल मजबूती और खतरे के मॉडलिंग, मजबूत सुरक्षा नियंत्रण (पहुंच प्रबंधन, एन्क्रिप्शन, निगरानी), विशिष्टताओं और जोखिमों के अनुशासित तकनीकी दस्तावेज और प्रवेश परीक्षण के माध्यम से शोषण और सिस्टम विफलता को रोकने पर केंद्रित है।

दूसरी ओर, विश्वास के लिए डिजाइनिंग यह सुनिश्चित करके आगे बढ़ती है कि सिस्टम संदर्भ में हितधारकों की जरूरतों को विश्वसनीय रूप से पूरा करता है, जिसके लिए पूरे जीवनचक्र में हितधारकों को शामिल करना, प्रक्रिया में पारदर्शिता बनाना (ऑडिटेबिलिटी, मॉडल उद्गम और प्रशिक्षण-डेटा दस्तावेज़ीकरण), कई दर्शकों (अंतिम-उपयोगकर्ताओं, डोमेन विशेषज्ञों, नियामकों) के लिए अनुकूल व्याख्या प्रदान करना, तीसरे पक्ष की समीक्षा के माध्यम से बाहरी रूप से प्रदर्शन को मान्य करना, बॉक्स-टिक के बजाय सार्थक मानवीय निरीक्षण बनाए रखना, विभिन्न आबादी और स्थितियों में वास्तविक दुनिया के परिणामों की निगरानी करना और शासन को बनाए रखना शामिल है। फीडबैक लूप जो नैतिक या प्रदर्शन संबंधी मुद्दों का सबूत होने पर अनुकूलित हो जाते हैं।

विश्वास के लिए आवश्यक निवेश

विश्वास के लिए स्पष्ट रूप से निर्माण उपकरण अक्सर कीमत के साथ आते हैं। फिर भी जब विश्वास मायने रखता है तो ये निवेश आवश्यक होते हैं – स्वास्थ्य देखभाल, वित्त, आपराधिक न्याय, नियुक्ति, उधार और किसी भी क्षेत्र में जहां एआई निर्णय सीधे मानव कल्याण को प्रभावित करते हैं।

वर्तमान नियामक ढाँचे इस अंतर को तेजी से पहचान रहे हैं।

ईयू एआई अधिनियम कुछ अनुप्रयोगों को “उच्च जोखिम” के रूप में वर्गीकृत करता है और उन प्रणालियों के लिए व्यापक दस्तावेज़ीकरण, बाहरी ऑडिटिंग और पारदर्शिता की मांग करता है क्योंकि अकेले सुरक्षा अपर्याप्त है।

एनआईएसटी का एआई जोखिम प्रबंधन ढांचा केवल सुरक्षा या सटीकता ही नहीं बल्कि विश्वसनीयता के कई आयामों को स्पष्ट रूप से संबोधित करता है।

आईएसओ/आईईसी ढांचे जैसे उभरते मानक, निष्पक्षता, व्याख्यात्मकता और मजबूती के आधार पर सत्यापन योग्य विश्वसनीयता के लिए मानदंड विकसित कर रहे हैं।

जैसे-जैसे एआई लाखों लोगों को प्रभावित करने वाले निर्णय लेने में तेजी से शामिल होता जा रहा है, अंतर केवल शैक्षणिक नहीं बल्कि मूलभूत हो गया है। जो संगठन अंतर को पहचानते हैं और उनमें निवेश करते हैं, उनके वास्तविक विश्वास के योग्य सिस्टम बनाने की अधिक संभावना होती है।

सुरक्षा एक आवश्यक आधार है. इसमें कोई शक नहीं। लेकिन विश्वास एक व्यापक सामाजिक और संबंधपरक संपत्ति है। आख़िरकार, कोई भी ऐसी प्रणाली पर भरोसा नहीं करना चाहता जिसके बारे में उन्हें पता हो कि वह असुरक्षित या अविश्वसनीय है।

–

(व्यक्त विचार निजी हैं)

लेखक के बारे में: प्रोफेसर बलरामन रवींद्रन आईआईटी मद्रास में डेटा साइंस एंड आर्टिफिशियल इंटेलिजेंस (DSAI), वाधवानी स्कूल ऑफ डेटा साइंस एंड आर्टिफिशियल इंटेलिजेंस (WSAI), रॉबर्ट बॉश सेंटर फॉर डेटा साइंस एंड आर्टिफिशियल इंटेलिजेंस (RBCDSAI) और सेंटर फॉर रिस्पॉन्सिबल AI (CeRAI) विभाग के प्रमुख हैं। उनकी शोध रुचियां बातचीत से और उसके माध्यम से सीखने पर केंद्रित हैं और ज्यामितीय गहन शिक्षण और सुदृढीकरण सीखने के क्षेत्रों तक फैली हुई हैं। इसके अतिरिक्त, वह सेंटर फॉर रिस्पॉन्सिबल एआई (सीईआरएआई) से जुड़े हुए हैं, जहां उनके काम का उद्देश्य विभिन्न डोमेन में एआई प्रौद्योगिकियों के जिम्मेदार विकास और तैनाती को बढ़ावा देना है, साथ ही यह सुनिश्चित करना है कि वे पारदर्शी, निष्पक्ष और सामाजिक मूल्यों के साथ संरेखित हों।

(टैग्सटूट्रांसलेट)कृत्रिम बुद्धिमत्ता में भरोसा(टी)एआई सिस्टम में सुरक्षा(टी)एआई डिजाइन में व्याख्या(टी)एआई में निष्पक्षता(टी)एआई जोखिम प्रबंधन ढांचा

Discover more from Star News 24 Live

Subscribe to get the latest posts sent to your email.

आईआईटी प्रोफेसर लिखते हैं| प्रौद्योगिकी समाचार