वीडियो जनरेटर सोरा एआई को प्रशिक्षित करने के लिए ओपनएआई ने यूट्यूब और इंस्टाग्राम के वीडियो का उपयोग किया होगा। यदि कोई यह साबित करने में सक्षम है कि उसने उपयोगकर्ता या प्लेटफ़ॉर्म सामग्री के बिना सोशल मीडिया पोस्ट का उपयोग किया है, तो OpenAI एक बड़े मुकदमे पर विचार कर सकता है।
हालाँकि इसका कोई स्पष्ट प्रमाण नहीं है, अल्फाबेट के कुछ लोगों सहित कई एआई विशेषज्ञों का मानना है कि सोरा के ओपनएआई के एआई वीडियो जनरेटर को वीडियो प्लेटफार्मों और यूट्यूब और इंस्टाग्राम जैसे सोशल मीडिया प्लेटफार्मों से स्क्रब किए गए डेटा पर प्रशिक्षित किया गया था।
यदि OpenAI ने वास्तव में सोरा को प्रशिक्षित करने के लिए इस डेटा का उपयोग किया था, तो उसे प्लेटफ़ॉर्म से कोई मंजूरी या लाइसेंस नहीं मिला। और यह सैम अल्टमैन के एआई उद्यम के लिए परेशानी का कारण बन सकता है।
YouTube के मुख्य कार्यकारी अधिकारी नील मोहन के अनुसार, OpenAI के टेक्स्ट-टू-वीडियो जनरेटर को प्रशिक्षित करने के लिए YouTube वीडियो का उपयोग करना प्लेटफ़ॉर्म की सेवा की शर्तों का एक बड़ा उल्लंघन होगा।
मोहन ने कहा कि निर्माता उम्मीद करते हैं कि यूट्यूब पर अपलोड किए जाने पर उनकी सामग्री सुरक्षित रहेगी। ऐसी ही एक अपेक्षा यह है कि मंच पर मौजूद लोग मंच के नियमों का पालन करेंगे। वे यह भी उम्मीद करते हैं कि उनकी सामग्री का उनकी स्पष्ट स्वीकृति के साथ किसी भी व्यावसायिक उद्देश्य के लिए पुन: उपयोग नहीं किया जाएगा।
इस मामले पर अपनी पहली सार्वजनिक टिप्पणी में, मोहन ने स्पष्ट किया कि उन्हें इस बात की प्रत्यक्ष जानकारी नहीं है कि क्या OpenAI ने सोरा को परिष्कृत करने के लिए YouTube वीडियो का उपयोग किया था। हालाँकि, उन्होंने इस बात पर जोर दिया कि इस तरह की कार्रवाइयां स्पष्ट रूप से YouTube की सेवा की शर्तों का उल्लंघन करेंगी।
चैटजीपीटी और डीएएलएल-ई जैसे लोकप्रिय सामग्री निर्माण टूल सहित एआई मॉडल को प्रशिक्षित करने के लिए उपयोग की जाने वाली सामग्रियों पर बहस ने व्यापक चर्चा छेड़ दी है। सोरा जैसे जेनरेटिव एआई उपकरण अपनी क्षमताओं को बेहतर बनाने के लिए इंटरनेट को खंगालने पर भरोसा करते हैं, चाहे वह वीडियो, फोटो या यहां तक कि टेक्स्ट तैयार करने के लिए हो।
जबकि OpenAI और Google जैसी कंपनियां अधिक उन्नत AI मॉडल विकसित करने और AGI तक पहुंचने वाली पहली कंपनी बनने के लिए कड़ी मेहनत कर रही हैं, उन्हें अपने मॉडल को प्रभावी ढंग से प्रशिक्षित करने के लिए सामग्री या डेटा के लिए व्यापक पूल की आवश्यकता है।
हाल ही में एक साक्षात्कार में, ओपनएआई के मुख्य प्रौद्योगिकी अधिकारी, मीरा मुराती को उस समय मौके पर खड़ा कर दिया गया जब उनसे पूछा गया कि क्या ओपनएआई ने सोरा को प्रशिक्षित करने के लिए वीडियो डेटा के लिए सोशल मीडिया प्लेटफार्मों और यूट्यूब जैसे प्लेटफार्मों की जांच की। मुराती सवाल का जवाब देने में असमर्थ थीं और उन्होंने दावा किया कि जहां तक उनका सवाल है, वह अनिश्चित थीं।
रिपोर्टों से संकेत मिलता है कि OpenAI ने सार्वजनिक YouTube वीडियो के ट्रांस्क्रिप्शन का उपयोग करके अपने आगामी बड़े भाषा मॉडल, GPT-5 को प्रशिक्षित करने का पता लगाया है। मोहन ने कहा कि Google, YouTube की मूल कंपनी, अपने स्वयं के AI मॉडल, जेमिनी को प्रशिक्षित करने के लिए YouTube वीडियो के उपयोग पर विचार करने से पहले रचनाकारों के साथ व्यक्तिगत अनुबंधों का सम्मान करती है।
मोहन ने यह सुनिश्चित करने के महत्व पर भी प्रकाश डाला कि YouTube वीडियो का कोई भी उपयोग रचनाकारों के लाइसेंसिंग समझौतों और सेवा की शर्तों के अनुरूप हो। हालाँकि YouTube की सामग्री के एक हिस्से का उपयोग जेमिनी जैसे AI मॉडल के प्रशिक्षण के लिए किया जा सकता है, लेकिन Google और YouTube रचनाकारों के अनुबंध और सेवा की शर्तों के अनुपालन को प्राथमिकता देते हैं।