टेक मीडिया आउटलेट द डिकोडर (सितंबर 18) ने एक ब्लॉग पोस्ट प्रकाशित किया जिसमें बताया गया कि एनवीडिया के वरिष्ठ वैज्ञानिक जिम फैन ने भविष्यवाणी की है कि रोबोटिक्स क्षेत्र अगले कुछ वर्षों में "जीपीटी-3 क्षण" की शुरुआत करेगा।
जिम फैन के बारे में
जिम फैन ने अपनी पीएच.डी. प्राप्त की। स्टैनफोर्ड विश्वविद्यालय के विज़न लैब से, जहाँ उन्होंने प्रोफेसर फ़ेइफ़ी ली की देखरेख में अध्ययन किया। उनकी शोध रुचियों में मल्टीमॉडल मौलिक मॉडल, सुदृढीकरण सीखना और कंप्यूटर विज़न शामिल हैं, और उन्होंने Google क्लाउड AI, OpenAI और Baidu सिलिकॉन वैली AI लैब जैसे प्रसिद्ध संगठनों में इंटर्नशिप की है।
जिम फैन वर्तमान में NVIDIA में AI-संबंधित अनुसंधान का नेतृत्व करते हैं, और उनकी टीम ह्यूमनॉइड रोबोट के लिए एक बुनियादी मॉडल बनाने के कंपनी के प्रयासों "प्रोजेक्ट ग्रूट" पर काम कर रही है।

अगले दो से तीन वर्षों में अनुसंधान में सफलताएँ
जिम फैन का अनुमान है कि अगले 2-3 वर्षों में रोबोट के बुनियादी मॉडलों के अनुसंधान में बड़ी सफलताएँ मिलेंगी, लेकिन वह यह भी स्वीकार करते हैं कि रोबोट को दैनिक जीवन में प्रवेश करने में अधिक समय लगेगा।
सिकोइया कैपिटल के साथ एक साक्षात्कार में, फैन ने कहा कि उन्हें रोबोटिक्स में एक "जीपीटी-3 मोमेंट" की उम्मीद है - मूलभूत रोबोटिक्स मॉडल में एक सफलता जो भाषा प्रसंस्करण में जीपीटी-3 के प्रभाव को टक्कर देती है।
आईटी होम अपने विचारों का अनुवाद इस प्रकार करता है:
लोगों के दैनिक जीवन में रोबोट लाना सिर्फ तकनीक का मामला नहीं है। रोबोटों को किफायती और बड़े पैमाने पर उत्पादित करने की आवश्यकता है, और हमें हार्डवेयर सुरक्षा के साथ-साथ गोपनीयता और नियामक सुरक्षा उपायों की भी आवश्यकता है।
दुनिया मानव रूप के इर्द-गिर्द बनी है, है ना? हमारे रेस्तरां, कारखाने, अस्पताल और सभी उपकरण और उपकरण - वे सभी मानव रूप और हाथों के लिए डिज़ाइन किए गए हैं।
उनका तर्क है कि, सिद्धांत रूप में, एक सक्षम ह्यूमनॉइड रोबोट कोई भी कार्य कर सकता है जो एक मानव कर सकता है, उनका अनुमान है कि ह्यूमनॉइड रोबोट हार्डवेयर का पारिस्थितिकी तंत्र दो से तीन वर्षों के भीतर तैयार हो जाएगा।
NVIDIA का रोबोटिक्स-संबंधित अनुसंधान
रोबोटिक एआई विकसित करते समय एनवीडिया तीन डेटा प्रकारों के संयोजन का उपयोग करता है: इंटरनेट डेटा, सिम्युलेटेड डेटा और वास्तविक दुनिया का रोबोट डेटा। डॉ. फैन प्रत्येक दृष्टिकोण की ताकत और कमजोरियों पर प्रकाश डालते हैं और मानते हैं कि उनका संयोजन सफलता की कुंजी है।
एनवीडिया "यूरेका" जैसी प्रौद्योगिकियों पर काम कर रहा है, जो प्रक्रियाओं को स्वचालित करने के लिए बॉट-प्रशिक्षित रोबोटों के लिए इनाम फ़ंक्शन उत्पन्न करने के लिए भाषा मॉडल का उपयोग करता है।
वास्तविक दुनिया के अलावा, फैन की टीम वीडियो गेम जैसे आभासी वातावरण में उपयोग के लिए एआई एजेंटों पर भी काम कर रही है। उन्होंने इन डोमेन के बीच समानता की पहचान की और एक एकीकृत मॉडल विकसित करने के लिए काम किया जो लंबी अवधि में आभासी और भौतिक दोनों एजेंटों को नियंत्रित करेगा।
