मेटा ने एआई लॉन्च किया जो मानव भागीदारी कम होने पर अन्य एआई की निगरानी कर सकता है

October 19, 2024

7

न्यूयॉर्क:

फेसबुक के मालिक मेटा ने शुक्रवार को कहा कि वह अपने अनुसंधान प्रभाग से नए एआई मॉडल का एक बैच जारी कर रहा है, जिसमें एक “स्व-सिखाया मूल्यांकनकर्ता” भी शामिल है जो एआई विकास प्रक्रिया में कम मानवीय भागीदारी की दिशा में एक रास्ता पेश कर सकता है।

यह रिलीज़ अगस्त के पेपर में मेटा द्वारा टूल की शुरूआत के बाद हुई है, जिसमें बताया गया है कि यह मॉडल की प्रतिक्रियाओं के बारे में विश्वसनीय निर्णय लेने के लिए ओपनएआई के हाल ही में जारी ओ1 मॉडल द्वारा उपयोग की जाने वाली उसी “विचार श्रृंखला” तकनीक पर कैसे निर्भर करता है।

उस तकनीक में जटिल समस्याओं को छोटे तार्किक चरणों में तोड़ना शामिल है और यह विज्ञान, कोडिंग और गणित जैसे विषयों में चुनौतीपूर्ण समस्याओं पर प्रतिक्रियाओं की सटीकता में सुधार करती प्रतीत होती है।

मेटा के शोधकर्ताओं ने मूल्यांकनकर्ता मॉडल को प्रशिक्षित करने के लिए पूरी तरह से एआई-जनरेटेड डेटा का उपयोग किया, साथ ही उस स्तर पर मानव इनपुट को भी समाप्त कर दिया।

परियोजना के पीछे के दो मेटा शोधकर्ताओं ने रॉयटर्स को बताया कि एआई का मूल्यांकन करने के लिए एआई का उपयोग करने की क्षमता स्वायत्त एआई एजेंटों के निर्माण की दिशा में संभावित मार्ग पर एक झलक प्रदान करती है जो अपनी गलतियों से सीख सकते हैं।

एआई क्षेत्र में कई लोग ऐसे एजेंटों की कल्पना डिजिटल सहायक के रूप में करते हैं जो मानवीय हस्तक्षेप के बिना कार्यों की एक विस्तृत श्रृंखला को पूरा करने के लिए पर्याप्त बुद्धिमान हों।

स्व-सुधार मॉडल आज इस्तेमाल की जाने वाली अक्सर महंगी और अप्रभावी प्रक्रिया की आवश्यकता को कम कर सकते हैं जिसे मानव फीडबैक से सुदृढीकरण सीखना कहा जाता है, जिसके लिए मानव एनोटेटर्स से इनपुट की आवश्यकता होती है, जिनके पास डेटा को सटीक रूप से लेबल करने और जटिल गणित और लेखन प्रश्नों के उत्तरों को सत्यापित करने के लिए विशेष विशेषज्ञता होनी चाहिए। सही हैं.

शोधकर्ताओं में से एक, जेसन वेस्टन ने कहा, “हमें उम्मीद है, जैसे-जैसे एआई अधिक से अधिक सुपर-मानवीय होता जाएगा, यह अपने काम की जांच करने में बेहतर और बेहतर होता जाएगा, ताकि यह वास्तव में औसत मानव से बेहतर हो।”

उन्होंने कहा, “एआई के इस तरह के सुपर-मानवीय स्तर तक पहुंचने के विचार के लिए स्व-सिखाया जाने और स्व-मूल्यांकन करने में सक्षम होने का विचार मूल रूप से महत्वपूर्ण है।”

Google और एंथ्रोपिक सहित अन्य कंपनियों ने भी RLAIF, या AI फीडबैक से सुदृढीकरण सीखने की अवधारणा पर शोध प्रकाशित किया है। हालाँकि, मेटा के विपरीत, वे कंपनियाँ सार्वजनिक उपयोग के लिए अपने मॉडल जारी नहीं करती हैं।

मेटा द्वारा शुक्रवार को जारी किए गए अन्य एआई टूल में कंपनी के छवि-पहचान सेगमेंट एनीथिंग मॉडल का अपडेट शामिल है, एक उपकरण जो एलएलएम प्रतिक्रिया पीढ़ी के समय और डेटासेट को गति देता है जिसका उपयोग नई अकार्बनिक सामग्रियों की खोज में सहायता के लिए किया जा सकता है।

(शीर्षक को छोड़कर, यह कहानी एनडीटीवी स्टाफ द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से प्रकाशित हुई है।)

Source link

रणजी ट्रॉफी: अभिमन्यु ईश्वरन के शतक से बराबरी की बढ़त, बंगाल का उत्तर प्रदेश पर दबदबा | क्रिकेट समाचार

मेटा ने एआई लॉन्च किया जो मानव भागीदारी कम होने पर अन्य एआई की निगरानी कर सकता है

Related Articles

नवीनतम फंडिंग राउंड के बाद ChatGPT प्रतिद्वंद्वी Perplexity AI की कीमत अब 9 बिलियन डॉलर है

क्रिसमस 2024: छुट्टियों के मौसम के लिए उत्सव और फैशनेबल पोशाक विचार

Latest Articles

नवीनतम फंडिंग राउंड के बाद ChatGPT प्रतिद्वंद्वी Perplexity AI की कीमत अब 9 बिलियन डॉलर है

क्रिसमस 2024: छुट्टियों के मौसम के लिए उत्सव और फैशनेबल पोशाक विचार

मिजोरम में पैसे चुराने के आरोप में एक व्यक्ति की पीट-पीट कर हत्या करने के आरोप में दो गिरफ्तार: पुलिस

पोपुलर