एलोन मस्क ने कहा कि तकनीकी कंपनियों को अब अपने मॉडलों को प्रशिक्षित करने और परिष्कृत करने के लिए कृत्रिम डेटा-एआई द्वारा बनाई गई सामग्री पर निर्भर रहना पड़ सकता है। यह चैटजीपीटी जैसे अत्याधुनिक एआई सिस्टम विकसित करने के तरीके में एक महत्वपूर्ण बदलाव का प्रतीक है
और पढ़ें
कृत्रिम बुद्धिमत्ता की दुनिया में एक अजीब समस्या आ गई है: ऐसा लगता है कि इंटरनेट का मानव ज्ञान का खजाना आखिरकार अंतहीन नहीं है। टेस्ला और स्पेसएक्स के अरबपति एलोन मस्क ने खुलासा किया कि एआई कंपनियों ने 2024 तक सभी मानव-जनित डेटा को प्रभावी ढंग से “खत्म” कर दिया है।
के बारे में बात कर रहे हैं उनका एआई उद्यम, एक्सएआई, मस्क नोट किया गया कि तकनीकी कंपनियों को अब अपने मॉडलों को प्रशिक्षित करने और परिष्कृत करने के लिए कृत्रिम डेटा-एआई द्वारा बनाई गई सामग्री पर निर्भर रहना पड़ सकता है। यह चैटजीपीटी जैसे अत्याधुनिक एआई सिस्टम विकसित करने के तरीके में एक महत्वपूर्ण बदलाव का प्रतीक है।
ज्ञान के लिए एआई की भूख एक दीवार से टकराती है
ओपनएआई के जीपीटी-4 जैसे एआई मॉडल सीखने और सुधार करने के लिए भारी मात्रा में इंटरनेट-स्रोत डेटा पर निर्भर करते हैं। ये सिस्टम जानकारी में पैटर्न का विश्लेषण करते हैं, जिससे उन्हें वाक्य में अगले शब्द की तरह परिणामों की भविष्यवाणी करने में सक्षम बनाया जाता है। हालाँकि, मस्क ने बताया कि इस प्रशिक्षण डेटा की आपूर्ति का उपयोग किया जा चुका है, जिससे कंपनियों को वैकल्पिक तरीकों की तलाश करनी पड़ रही है। सिंथेटिक डेटा, जहां एआई अपनी स्वयं की सामग्री उत्पन्न करता है और इसे स्व-ग्रेडिंग और सीखने की प्रक्रिया के माध्यम से परिष्कृत करता है, एक प्रमुख विकल्प के रूप में उभरा है।
यह तकनीक पूरी तरह से नई नहीं है – मेटा और माइक्रोसॉफ्ट जैसे प्रमुख खिलाड़ियों ने पहले ही अपनी एआई विकास प्रक्रियाओं में सिंथेटिक डेटा को शामिल कर लिया है। जबकि सिंथेटिक डेटा एक जीवन रेखा प्रदान करता है, यह अनूठी चुनौतियाँ भी पेश करता है, विशेष रूप से सटीकता और रचनात्मकता को बनाए रखने के आसपास।
“मतिभ्रम” की समस्या
मस्क ने एआई “मतिभ्रम” के मुद्दे को भी उठाया। जहां मॉडल गलत या निरर्थक सामग्री उत्पन्न करते हैं। उन्होंने सिंथेटिक डेटा पर भरोसा करते समय इसे एक बड़ी बाधा बताया, क्योंकि वास्तविक और मनगढ़ंत जानकारी के बीच अंतर करना मुश्किल हो जाता है। अन्य विशेषज्ञों ने भी इन चिंताओं को दोहराया है। यूके के एलन ट्यूरिंग इंस्टीट्यूट के एंड्रयू डंकन ने चेतावनी दी कि सिंथेटिक डेटा का अत्यधिक उपयोग “मॉडल पतन” का कारण बन सकता है, जहां एआई आउटपुट की गुणवत्ता समय के साथ खराब हो जाती है। जैसे-जैसे एआई सिस्टम अपनी रचनाओं पर फ़ीड करते हैं, पक्षपातपूर्ण या कम रचनात्मक आउटपुट का जोखिम बढ़ जाता है।
डेटा नियंत्रण पर कानूनी लड़ाई
उच्च गुणवत्ता वाले प्रशिक्षण डेटा की यह कमी कानूनी विवादों को भी बढ़ावा दे रही है। ओपनएआई ने स्वीकार किया है कि चैटजीपीटी जैसे उपकरण कॉपीराइट सामग्री तक पहुंच के बिना मौजूद नहीं होंगे, जिससे रचनात्मक उद्योगों और प्रकाशकों के लिए मुआवजे पर बहस छिड़ गई है जिनका काम प्रशिक्षण के लिए उपयोग किया जाता है। इस बीच, एआई-जनित सामग्री की ऑनलाइन बढ़ती उपस्थिति चिंता पैदा करती है कि भविष्य के प्रशिक्षण डेटासेट सिंथेटिक सामग्री से भर सकते हैं, जिससे चक्र और जटिल हो सकता है।
जैसे-जैसे एआई कंपनियां इस नई सीमा पर आगे बढ़ेंगी, नैतिक और तकनीकी चुनौतियों के साथ नवाचार को संतुलित करना महत्वपूर्ण होगा। मस्क की टिप्पणियाँ एक ऐसी तकनीक की जटिलताओं को रेखांकित करती हैं जो अपनी नींव की तुलना में तेजी से आगे बढ़ रही है।