‘कंपनियों को अनुकूली, ऊर्जा-कुशल एआई मॉडल की ओर बढ़ने की जरूरत है’| प्रौद्योगिकी समाचार

sara1 1773710847487 1773710859410
Spread the love

पिछले 10 वर्षों में, आर्टिफिशियल इंटेलिजेंस उद्योग ने एआई मॉडल को स्केल करने, बड़े मॉडल बनाने पर ध्यान केंद्रित किया है जो अधिक डेटा संसाधित कर सकते हैं। इन मॉडलों को बनाने के लिए, बड़े पैमाने पर डेटा सेंटर बनाने की भी होड़ मची है जो इन मॉडलों के लिए गणना की पेशकश करते हैं और जिनकी लागत अरबों डॉलर है और एक शहर जितनी ऊर्जा की खपत करते हैं।

सारा हूकर. (विश्व आर्थिक मंच)
सारा हूकर. (विश्व आर्थिक मंच)

हालाँकि, पिछले साल के अंत से, एक्स के सम्मेलनों और स्क्रॉलिंग हॉलों में एआई शोधकर्ताओं की बढ़ती भीड़ यह घोषणा कर रही है कि मौजूदा अग्रणी एआई मॉडल अपनी सीमा तक पहुंच सकते हैं। दुनिया को एआई मॉडल बनाने के लिए नए, नवोन्मेषी तरीकों की जरूरत है।

इन्हीं आवाजों में से एक हैं सारा हूकर। अक्टूबर 2025 में, उन्होंने कोहेरे में एआई रिसर्च के वीपी के रूप में अपनी नौकरी छोड़ दी और कोहेरे के एक अन्य अनुभवी सुदीप रॉय के साथ अपना नया स्टार्टअप, एडैप्शन लैब्स शुरू किया। हुकर, जिन्होंने कोहेरे में रहने से पहले Google के AI मॉडल पर शोध किया था, आश्वस्त हैं कि भविष्य AI सिस्टम में है जो कम कंप्यूटिंग शक्ति का उपयोग करता है, चलाने की लागत कम होती है और उपयोगकर्ताओं की आवश्यकताओं के अनुकूल हो सकती है। इस साल फरवरी में, एडैप्शन लैब्स ने ऐसी सोच मशीनें बनाने के लिए 50 मिलियन डॉलर जुटाए जो अनुकूलन करती हैं और लगातार सीखती हैं और ऊर्जा-कुशल भी हैं।

हुकर एआई इम्पैक्ट शिखर सम्मेलन के लिए भारत में थे, और उन्होंने हिंदुस्तान टाइम्स के साथ एआई में इस और अन्य उभरते विचारों पर चर्चा की। संपादित अंश:

क्या लगातार बढ़ते एआई मॉडल का कोई विकल्प संभव है?

पिछले 10 वर्षों में एआई की प्रगति बड़े और बड़े मॉडलों के बारे में रही है क्योंकि यह सभी एआई फ्रंटियर प्रयोगशालाओं (ओपन एआई, एंथ्रोपिक, गूगल, मेटा, अमेज़ॅन, आदि) के लिए सफलता का एक बहुत ही अनुमानित सूत्र बन गया है। ये एआई मॉडल न केवल प्रशिक्षण में बल्कि उपयोगकर्ताओं को उत्तर देते समय भी अधिक कंप्यूटिंग फ़ुटप्रिंट की मांग करते हैं।

दो चीजें हैं जो बदल रही हैं और तकनीकी कंपनियों को इसे अपनाने की आवश्यकता होगी। एक, व्यवसाय यह मान रहा है कि एक साधारण प्रश्न पर इतना पैसा खर्च करना टिकाऊ नहीं है। दूसरा यह है कि ट्रांसफार्मर आर्किटेक्चर, जिस पर ये मॉडल आधारित हैं, अब संतृप्त हो गया है। फ्रंटियर एआई कंपनियों को अधिक गणना जोड़कर तिगुना या चौगुना प्रदर्शन लाभ नहीं मिल रहा है। प्रगति का अगला युग ऐसे मॉडल बनाने से आने वाला है जो दुनिया के साथ बातचीत और अनुकूलन करते हैं और कुशलतापूर्वक गणना का उपयोग करते हैं।

आप जो कह रहे हैं वह काफी विवादास्पद है और क्षेत्र के अन्य लोगों को भी विरोधाभासी लगता है। आपने स्केलिंग की धीमी मृत्यु पर एक पेपर लिखा है और बताया है कि स्केलिंग कंप्यूट इसका समाधान क्यों नहीं है।

तार्किक रूप से, यदि कार्य सरल है – जो उपयोगकर्ताओं से 90% एआई अनुरोध हैं – एआई मॉडल को कम गणना का उपयोग करना चाहिए। इससे कठिन समस्याओं पर गणना कार्यभार बढ़ना चाहिए। वर्तमान एआई मॉडल के साथ ऐसा नहीं हो रहा है क्योंकि वे स्थिर, अखंड और औसत के लिए अनुकूलित हैं। यही कारण है कि छोटे एआई मॉडल अब बड़े एआई मॉडल से कहीं बेहतर प्रदर्शन कर रहे हैं। कृत्रिम बुद्धिमत्ता का अगला चरण एक ऐसा मॉडल होगा जो आने वाले कार्य के आधार पर बदलता है और वास्तविक समय में अनुकूलित होता है। यह मानव बुद्धि की तरह है. हम अनुकूलन करते हैं, हम सीखते हैं।

यदि ट्रांसफार्मर संतृप्त हैं और अनुकूलन आगे बढ़ने का नया तरीका है, तो बिग टेक नया दृष्टिकोण क्यों नहीं अपना रहा है?

अलग राह पहचानने वाले लोगों में भारी जड़ता है। पिछले दस वर्षों में, अधिक गणना की चाहत ने हमारे पारिस्थितिकी तंत्र के बारे में सब कुछ बदल दिया है। कंपनियों ने प्री-ट्रेनिंग और पोस्ट-ट्रेनिंग टीमों को खामोश कर दिया है। उन सभी ने इस धारणा पर काम किया कि यदि आप एक ऐसा मॉडल बनाते हैं जो सबकुछ कवर करता है और इसे दुनिया में फेंक देता है, तो आप उम्मीद करते हैं कि यह उन सभी कार्यों के लिए काम करेगा जो इसे दिए गए हैं।

चूंकि ट्रांसफार्मर का दृष्टिकोण संतृप्त है, चीजें बदल रही हैं। अलग-अलग कंपनियां अलग-अलग तरीके आजमा रही हैं। आप वास्तविक समय में मॉडल को कैसे अनुकूलित करते हैं? आप अलग-अलग समस्याओं पर अलग-अलग गणना कैसे खर्च करते हैं? क्या हमें नए हार्डवेयर डिज़ाइन की आवश्यकता है?

जब हमने पिछले साल अक्टूबर में एडाप्टेशन लैब्स शुरू की थी, तो लोग बहुत सशंकित थे, लेकिन पहले से ही मैंने उद्योग जगत को ‘निरंतर सीखने’ शब्द का अधिक बार उपयोग करते हुए सुना है, जिसका मूल रूप से तात्पर्य उपयोगकर्ताओं के लिए वास्तविक समय में अनुकूलन करने वाले एआई मॉडल से है। मुझे लगता है कि यह नया युग है और एक साल में यह एक प्रमुख दर्शन बन जाएगा।

आपने एआई मॉडल अनुकूलन के विचार के लिए शुरुआती फंड के रूप में 50 मिलियन डॉलर जुटाए हैं। वह कैसे काम करता है?

हम संपूर्ण एआई स्टैक को अधिक लचीला बनाना चाहते हैं ताकि यह पे-दोह जैसे किसी भी कार्य के लिए अनुकूल हो सके। इसमें डेटा, अनुकूली बुद्धिमत्ता और स्वयं इंटरफ़ेस शामिल है। हम यह बदलना चाहते हैं कि कैसे लोग मॉडल के साथ इंटरैक्ट करने में सक्षम हों और फीडबैक लूप बनाने के लिए अंगूठे ऊपर, अंगूठे नीचे दृष्टिकोण से दूर चले जाएं जो अधिक गतिशील हो।

यूके और फ्रांस के बाद भारत का यह तीसरा AI प्रभाव शिखर सम्मेलन है। आप शिखर पर क्यों थे?

एआई प्रभाव शिखर सम्मेलन हमारे दृष्टिकोण को सामने रखने के लिए महत्वपूर्ण हैं कि यह तकनीक वैश्विक है। मेरे सह-संस्थापक और मैं दोनों अमेरिका में अप्रवासी हैं। मैं अफ़्रीका में बड़ा हुआ. आज तक मेरा अधिकांश काम इस बारे में रहा है कि हम कैसे मॉडलों को बहुभाषी, अनुकूलन में और दुनिया भर में उपयोग में अच्छा बना सकते हैं। जब अनुकूलन की बात आती है, जहां हम नवप्रवर्तन करना चाहते हैं, तो वैश्विक दृष्टिकोण हमारे लिए महत्वपूर्ण हैं। हम लोगों को एआई पर स्वामित्व रखने, उस पर काम करने, नियंत्रण करने और उसे आकार देने की सुविधा देना चाहते हैं।

इन शिखर सम्मेलनों से आशाजनक बात यह है कि लोग अमेरिका के बाहर पारिस्थितिकी तंत्र का निर्माण कर रहे हैं। शिखर सम्मेलन के दौरान, इन देशों ने अपने-अपने देशों में एआई अनुसंधान के लिए सरकारी फंडिंग की घोषणा की है और यह विश्व स्तर पर तकनीकी प्रतिभा का निर्माण करने के लिए महत्वपूर्ण है ताकि लोगों को अपने डेटा पर अधिक स्वामित्व मिल सके। हमारी अपनी टीम पूरी दुनिया में दूर से स्थापित है।

इंडिया एआई इम्पैक्ट समिट पर संदेह करने वालों का कहना है कि पिछले महीने दिल्ली में बहुत कुछ हासिल नहीं हुआ। आपका टेकअवे क्या है?

वर्तमान में, AI का उपयोग पूरी दुनिया में किया जाता है, लेकिन इसे कुछ ही स्थानों पर बनाया गया है और इस शिखर सम्मेलन और इसके जैसे अन्य लोगों ने इसे और अधिक वैश्विक बनाने के लिए पेंडुलम घुमाया है। यह एक बड़ा उत्प्रेरक है.

जो लोग शायद ही कभी एक ही कमरे में एक साथ रहते हों, एक-दूसरे से मिले, विचारों का आदान-प्रदान किया। यह तकनीकी प्रतिभा के लिए उत्प्रेरक तैयार करता है जो दुनिया के विभिन्न हिस्सों में नवाचार को आकार देता है। आपको उत्प्रेरकों को कभी भी कम नहीं आंकना चाहिए। अब से छह महीने बाद जो होगा वह और अधिक दिलचस्प होगा। और इसीलिए मैं यहां था.

आप भूराजनीतिक रूप से तनावपूर्ण माहौल में वैश्वीकरण की बात कर रहे हैं।

दो चीजें एक ही समय में मौजूद हो सकती हैं। तकनीकी पारिस्थितिकी तंत्र में अधिक गतिशीलता और चर्चा हो सकती है, जबकि भू-राजनीतिक तनाव मौजूद है। मैं इस बात पर ध्यान केंद्रित करना चाहता हूं कि हम वैश्विक प्रतिभा का समर्थन कैसे कर सकते हैं क्योंकि ये तकनीकी हस्तक्षेप वर्तमान राजनीतिक तनावों से अधिक समय तक चलेंगे।

सॉवरेन एआई मॉडल बनाने के बारे में आपकी क्या राय है?

राष्ट्रीय एआई मॉडल उनके द्वारा बनाए गए पारिस्थितिकी तंत्र से कम महत्वपूर्ण नहीं हैं। एक प्रतिस्पर्धी मॉडल बनाने के लिए, आपको एक गहन प्रतिभा घनत्व बनाना होगा। अभी, दुनिया में केवल कुछ सौ लोग हैं – शायद कुल मिलाकर 700 – जो एआई मॉडल को प्री-ट्रेन, पोस्ट-ट्रेन और संरेखित करने की पूरी पाइपलाइन जानते हैं। उनके पास बहुत सारे संसाधन उपलब्ध हैं।

लेकिन इसका ऐसा ही बने रहने का कोई कारण नहीं है। यदि एआई पारिस्थितिकी तंत्र विकसित करने में संप्रभु मॉडल एक राष्ट्रीय उत्प्रेरक बन जाता है, तो यह बहुत उपयोगी है।

भारत की ताकत यह है कि यहां के युवाओं की महत्वाकांक्षाएं बहुत बड़ी हैं। भारत को इन लोगों को तकनीकी उत्कृष्टता के बारे में गहराई से ध्यान देने के लिए प्रेरित करने की आवश्यकता है, जो कि आपको नवाचार के लिए आवश्यक है।

यदि आप जिस सपने के बारे में सोच रहे हैं वह अगले पांच वर्षों में पूरा हो जाता है, तो क्या कष्टप्रद त्वरित इंजीनियरिंग की आवश्यकता खत्म हो जाएगी?

मौजूदा मॉडल अच्छे से काम नहीं करते क्योंकि वे औसत के लिए अनुकूलित हैं। यदि आप अरबों लोगों को एक विशाल स्थिर मॉडल भेजते हैं, तो अंतिम उपयोगकर्ता – चाहे वह आप हों या कोई उद्यम – को मॉडल से उत्तर प्राप्त करने के लिए कलाबाजी करने की आवश्यकता होती है। इसे ही आज हम प्रॉम्प्ट इंजीनियरिंग कहते हैं।

बड़े पैमाने पर जटिल संकेत एक मॉडल के लिए उपयोगकर्ता का समाधान हैं जो मूल रूप से उन्हें विफल कर देता है। जब एआई मॉडल हमारी आवश्यकताओं के अनुरूप ढल जाएंगे, तब भी हमें पहला संकेत लिखना होगा, लेकिन सूक्ष्म विवरण नहीं देना होगा।

हमें इसके साथ जुड़ने में सक्षम होना चाहिए, उन क्षेत्रों को उजागर करना चाहिए जिन्हें हम सोचते हैं कि बदलने की आवश्यकता है और मॉडल तुरंत वास्तविक समय में अपने व्यवहार को आकार देगा। मुझे लगता है कि त्वरित इंजीनियरिंग को ख़त्म कर दिया जाएगा।

विशाल डेटा केंद्रों के बारे में क्या? जैसे-जैसे मॉडल अधिक कुशल होते जाएंगे, क्या वे भी ख़त्म होते जाएंगे?

डेटा सेंटर की आवश्यकता इस बात पर निर्भर करती है कि कितने लोग एआई का उपयोग कर रहे हैं। जैसा कि हमारा लक्ष्य सभी को एआई की पहुंच प्रदान करना है, हमें इसके लिए अधिक डेटा केंद्रों और अधिक ऊर्जा की आवश्यकता होगी। हम एआई मॉडल को यथासंभव कुशल बना सकते हैं, लेकिन चूंकि उपयोग में बड़े पैमाने पर वृद्धि होने जा रही है, मुझे नहीं लगता कि डेटा केंद्रों और ऊर्जा की आवश्यकता खत्म हो जाएगी। यह वैश्विक और राष्ट्रीय स्तर पर एक नीतिगत बातचीत है।


Discover more from Star News 24 Live

Subscribe to get the latest posts sent to your email.

Leave a Reply

Discover more from Star News 24 Live

Subscribe now to keep reading and get access to the full archive.

Continue reading