बॉट और नया है?: कैप्चा कैसे एआई को प्रशिक्षित कर रहा है, प्राचीन ग्रंथों को पढ़ रहा है

Each time we click on a grid of images to identify 1771596805864
Spread the love

यह अनिवार्य रूप से एक परीक्षण है जिसका उद्देश्य बॉट्स को मनुष्यों से अलग करना, पहले को अवरुद्ध करना और बाद में प्रवेश कराना है। इसीलिए इसे कंप्यूटर और इंसानों को अलग बताने के लिए पूर्णतः स्वचालित सार्वजनिक ट्यूरिंग परीक्षण कहा जाता है। लेकिन इसकी विशाल पहुंच और उत्कृष्ट पाठ पहचान क्षमताओं के कारण, कैप्चा सॉफ़्टवेयर का उपयोग कई अन्य तरीकों से किया गया है। नज़र रखना।

हर बार जब हम अग्नि हाइड्रेंट, साइकिल या यातायात सिग्नल के हिस्सों की पहचान करने के लिए छवियों के ग्रिड पर क्लिक करते हैं, तो हम बड़े पैमाने पर डेटासेट में योगदान दे रहे हैं।
हर बार जब हम अग्नि हाइड्रेंट, साइकिल या यातायात सिग्नल के हिस्सों की पहचान करने के लिए छवियों के ग्रिड पर क्लिक करते हैं, तो हम बड़े पैमाने पर डेटासेट में योगदान दे रहे हैं।

शोधकर्ताओं को प्राचीन ग्रंथ पढ़ने में मदद करना

अब दशकों से, पुस्तकालयों, प्रकाशन गृहों और मीडिया कंपनियों को ग्रंथों को डिजिटल बनाने का प्रयास एक शाश्वत समस्या का सामना करना पड़ रहा है: लोगों का एक शब्द पर नज़रें गड़ाकर इकट्ठा होना और चले जाना: वह क्या कहता है?!

कुछ मामलों में, पांडुलिपियाँ ख़राब हो गई हैं; अन्य में, पुराना अखबारी कागज फीका पड़ गया है।

कैप्चा का उपयोग करते हुए, यह पता चला कि बिखरी हुई भीड़ प्रतीकात्मक रूप से इकट्ठा होकर और गलत अक्षर क्या हो सकते हैं, इसका अनुमान लगाने में मदद कर सकती है।

यहां बताया गया है कि यह कैसे काम करता है: अक्षर और शब्द जिन्हें चरित्र-पहचान सॉफ़्टवेयर विश्वसनीय रूप से समझ नहीं सका, उन्हें कैप्चा चुनौतियों के रूप में पुन: उपयोग किया गया, और उनके विकृत रूपों में प्रस्तुत किया गया। जैसे ही दुनिया भर के इंटरनेट उपयोगकर्ताओं ने उनके मन में आने वाले पत्र को टाइप किया, परिणाम अक्सर एक अहा क्षण उत्पन्न करते थे, जो पुरालेखपालों ने जो अनुमान लगाया था उसकी पुष्टि करता था। अन्य समय में, परीक्षण ने द न्यूयॉर्क टाइम्स सहित प्रमुख अभिलेखों के लिए उच्च-विश्वास वाले प्रतिलेखन का उत्पादन करने के लिए पर्याप्त मजबूत उपयोगकर्ता सहमति उत्पन्न की।

इतना ही नहीं था. प्रौद्योगिकी संग्रह करने के तरीके को ही बदल देगी।

2007-08 तक, NYT ने अपने संग्रह को डिजिटाइज़ करने में मदद के लिए कार्नेगी मेलॉन विश्वविद्यालय, जहां कैप्चा विकसित किया गया था, से संपर्क किया था, जो 1851 तक फैला हुआ है।

मई 2009 तक, परिणाम स्पष्ट थे। “NYT में सॉफ्टवेयर पर एक लेख में NYT में डिजिटल संचालन के तत्कालीन मुख्य प्रौद्योगिकी अधिकारी मार्क फ्रोंस ने कहा, अब तक, लगभग 30 वर्षों के अभिलेखागार में रहस्यमय शब्दों को reCAPTCHAs के साथ समझा गया है।

इससे पहले, टाइपिस्टों ने सामग्री को लिखने में लगभग 10 साल बिताए थे, और केवल 27 साल के अभिलेखों को कवर किया था। reCAPTCHA सॉफ़्टवेयर का उपयोग करके, 2011 तक, पूरे संग्रह को डिजिटल कर दिया गया और जनता के लिए खोजने योग्य बना दिया गया।

लुप्त होता लोगो

क्या उपयोगकर्ताओं को पता होना चाहिए कि क्या कैप्चा परीक्षणों में कोई बड़ा मिशन चल रहा है?

स्पष्ट उत्तर हां है. लेकिन कैप्चा का उद्देश्य घर्षण को न्यूनतम रखना है। यह पहले से ही ट्रैफ़िक को रोक रहा है, बस मौजूदा द्वारा। इसलिए यह सोचा गया कि उपयोगकर्ताओं को यह जानने की आवश्यकता नहीं है कि परीक्षण का उपयोग किस लिए किया जा सकता है।

यह, जैसा कि इंटरनेट पर बहुत कुछ है, एक फिसलन भरी ढलान साबित होगी।

2007 की शुरुआत में, कुछ वेबसाइटों ने जुड़ाव और विज्ञापन-समर्थित कैप्चा के साथ प्रयोग करना शुरू कर दिया था, जो उपयोगकर्ताओं से छवियों को रेट करने या ब्रांडेड संकेतों को हल करने के लिए कह रही थी, जिसकी पृष्ठभूमि में अज्ञात राजस्व मॉडल छिपे हुए थे। सत्यापन प्रक्रिया के मुद्रीकरण के ऐसे प्रयासों ने अंततः गोपनीयता संबंधी चिंताओं को बढ़ा दिया और प्रमुखता खो दी।

एआई के लिए निःशुल्क प्रशिक्षण सामग्री

छवि-आधारित रीकैप्चा परीक्षणों का प्रसिद्ध रूप से उपयोग किया गया था – और अभी भी उपयोग किया जा रहा है – एआई मॉडल से लेकर सेल्फ-ड्राइविंग कारों के लिए सॉफ़्टवेयर तक के एल्गोरिदम को प्रशिक्षित करने के लिए।

हर बार जब हम अग्नि हाइड्रेंट, साइकिल या यातायात सिग्नल के हिस्सों की पहचान करने के लिए छवियों के ग्रिड पर क्लिक करते हैं, तो हम बड़े पैमाने पर डेटासेट में योगदान दे रहे हैं। इस तरह, एआई ने हम सभी से सीखा है कि कबूतर कैसा दिखता है; और स्व-ड्राइविंग कार्यक्रमों ने दुनिया को देखना सीख लिया है।

उपयोगकर्ताओं को यह नहीं बताया गया कि क्लिक का उपयोग इसी लिए किया जा रहा है। इस बीच, जिन लोगों ने योगदान नहीं दिया, या नहीं कर सके, उन्होंने खुद को बाहर पाया।

reCAPTCHA दिव्यांगों के लिए विशेष रूप से कठिन था। आम तौर पर कुछ मनुष्यों तक पहुंच को सीमित करने के लिए ऐसे परीक्षणों की प्रवृत्ति पर अब ध्यान दिया जा रहा है।

भारत और दुनिया भर में सरकार द्वारा संचालित वेबसाइटें इमेजरी के लिए ऑडियो और टेक्स्ट-आधारित विकल्प तेजी से पेश कर रही हैं। बहुभाषी देशों में प्रमुख सार्वजनिक प्लेटफार्मों ने कई भाषाओं में सत्यापन का समर्थन करना शुरू कर दिया है।

डेवलपर्स ने डिज़ाइन-आधारित परीक्षणों का प्रयोग भी शुरू कर दिया है जिसमें उपयोगकर्ता को “क्रॉसवॉक” या “ट्रैफ़िक कोन” जैसे संस्कृति-विशिष्ट संदर्भों के बजाय समरूपता और स्थानिक तर्क की समझ का उपयोग करना चाहिए।

बॉट-सहायकों को दूर रखना

बॉट्स बनाम इंसानों की इस दुनिया में एक दिलचस्प ग्रे क्षेत्र में कैप्चा-समाधान सेवाएं शामिल हैं।

ऐसी सेवाएँ स्वचालित प्रणालियों की ओर से प्रतिदिन हजारों चुनौतियों का समाधान करने के लिए बहुत कम वेतन वाले कर्मचारियों को नियुक्त करती हैं। चूँकि इसका समाधान मनुष्य ही कर रहे हैं, इसलिए यह मौजूदा कानूनों को नहीं तोड़ता है। चूँकि ऐसा इसलिए किया जा रहा है ताकि एक बॉटनेट वहाँ पहुँच सके जहाँ वह अन्यथा नहीं पहुँच पाता, यह बिल्कुल कोषेर नहीं है।

ऐसे मॉडल उन वेबसाइटों के लिए परेशानी खड़ी करते हैं जो समयबद्ध सेवाएं (कॉन्सर्ट टिकट, परिवहन कंपनियां) प्रदान करते हैं या जिनमें अत्यधिक संवेदनशील डेटा (बैंकिंग और हेल्थकेयर प्लेटफॉर्म) होते हैं। ऐसी साइटों को ऐसे प्रयासों को रोकने और पराजित करने के प्रयासों में तेजी से जटिल कैप्चा परीक्षणों को तैनात करने के लिए मजबूर किया जाता है।

उदाहरण के लिए, भारतीय रेलवे खानपान और पर्यटन निगम (आईआरसीटीसी) अपनी बुकिंग विंडो में तेजी से जटिल छवि और गणित-आधारित परीक्षणों का उपयोग कर रहा है। अन्य साइटों ने उस समय सीमा को कम कर दिया है जिसके भीतर उत्तर प्रस्तुत किया जाना चाहिए।

एक हैकर का उपयोगी उपकरण?

यह साबित करने के लिए कि आप इंसान हैं, हैकर्स अब उस परीक्षण का भी उपयोग कर रहे हैं, जहां वे नहीं हैं। नकली कैप्चा स्क्रीन पहेली को तुरंत हल करने की उपयोगकर्ता की प्रवृत्ति का फायदा उठाने के लिए डिज़ाइन की गई हैं। एक बार इस तरह से सिस्टम में प्रवेश करने के बाद, प्रोग्राम डिवाइस पर मैलवेयर डाउनलोड करता है और डेटा चुराना, ब्राउज़र को हाईजैक करना या ऐसी अन्य गतिविधि करना शुरू कर देता है।


Discover more from Star News 24 Live

Subscribe to get the latest posts sent to your email.

Leave a Reply

Your email address will not be published. Required fields are marked *

Discover more from Star News 24 Live

Subscribe now to keep reading and get access to the full archive.

Continue reading