आर्टिफिशियल इंटेलिजेंस (एआई) पैरेंट कंपनी ओपनएआई ने सोमवार 25 सितंबर 2023 को घोषणा की है कि चैटजीपीटी अब बातचीत करने के लिए भी पूरी तरह से तैयार हो चुका है। वॉइस और इमेज यानी आवाज और छवि क्षमताओं के माध्यम से, ओपनएआई ने कहा कि यह नया इंटरफेस पहले से कहीं ज्यादा सहज है। यह किसी भी प्रोग्राम का उपयोग करने के, पहले से ज्यादा तरीके प्रदान करेगा।
नए चैटजीपीटी से बातचीत आगे-पीछे होगी। उपयोगकर्ताओं के पास चलते-फिरते इससे बात करने, सोते समय परिवार के लिए कहानी सुनाने का अनुरोध करने या डिनर टेबल पर बहस निपटाने की क्षमता होगी।
ओपनएआई ने कहा, “चैटजीपीटी और इसके प्लस और एंटरप्राइज उपयोगकर्ताओं के बीच वॉइस वार्तालाप अगले दो सप्ताह में शुरू किया जाएगा। टेक्स्ट-टू-स्पीच मॉडल, वॉइस एक्टर्स के सहयोग से एकत्रित किया गया मानव-सा ऑडियो उत्पन्न करेगा।”
ओपनएआई में उपभोक्ता उत्पादों के वाइस प्रेसिडेंट पीटर डेंग ने कहा कि प्लेटफॉर्म पर पहले से ज्यादा उपयोगकर्ता प्राप्त करने के लिए वॉइस चैट को एकीकृत करना जोखिम का काम था। सबसे कठिन कार्यों में से एक है- उस अद्भुत तकनीक को लेना और उसे सरलता से अनुवाद करना, जिसे अगले 30 से 40 करोड़ लोग तलाश रहे हैं।
यह तकनीक अपने साथ कुछ नए जोखिम भी साथ ला रही है। इसके अंदर वह क्षमता है कि मात्र कुछ ही सेकेंड में यह किसी भी वास्तविक आवाज को बिल्कुल वास्तविक प्रतीत होने वाली नकल से बदल देता है। कंपनी ने स्वीकार किया कि कुछ सार्वजनिक हस्तियों की आवाज निकालकर कुछ (मिमिक्री आर्टिस्ट) कलाकार गलत भावना की वजह से इसके जरिए धोखाधड़ी भी कर सकते हैं। ऐसी धोखाधड़ी इस नई तकनीक के लिए सबसे बड़ा खतरा है। कंपनी ने कहा कि इसके बावजूद इस बात से मुंह नहीं मोड़ा जा सकता कि इस वॉइस तकनीक को विशेषतौर पर वॉइस चैट के लिए डिजाइन किया गया था। अमेजन की अलेक्सा और ऐपल की सीरी को सुनकर आपने पहले भी इन तकनीकी कंपनियों को करीब से समझा और जाना होगा।
ओपनएआई ने लिखा, “स्पोटिफाई अपने वॉइस ट्रांसलेशन फीचर को आगे लाने के लिए इस तकनीक का उपयोग कर रहा है, जो पॉडकास्ट को दूसरी भाषा में अनुवाद करके पोस्टकास्टर्स की कहानी कहने की पहुंच का विस्तार करने में मदद करता है। विशेष यह है कि यह फीचर पोडकास्ट को केवल दूसरी भाषा में अनुवाद ही नहीं करता, बल्कि दूसरी भाषा में इसे अनुवाद करते समय वह इसे पोडकास्टर की ऑरिजनल आवाज में ही अनुवाद कर देता है, जो वाकई खास है।”
साउंड टेक्नीक (आवाज प्रौद्योगिकी) के अलावा, पिक्चर कैपेबिलिटी (छवि क्षमताएं) भी सभी प्लेटफॉर्म्स पर उपलब्ध होंगी। एआई को यह जानने में मदद करने के लिए कि क्या पूछा जा रहा है, उपयोगकर्ता ड्राइंग टूल का उपयोग करके कई तस्वीरें अपलोड कर सकते हैं या फोटो के एक विशिष्ट हिस्से पर गोला लगा सकते हैं। यानी अब आप यात्रा के दौरान किसी ऐतिहासिक स्थल की तस्वीर लें और वहां क्या दिलचस्प है, इस बारे में लाइव बातचीत करें। जब आप घर पर हों तो यह पता लगाने के लिए कि रात के खाने में क्या है, अपने फ्रिज और किचन की तस्वीरें खींच लें। इसके बाद चैटजीपीटी के नए वर्जन का प्रयोग करें।