२५ वर्षीय भारतीय तरुणाने बनवला ‘इमोशनल वॉइस-टू-वॉइस AI मॉडल’

    दिनांक :31-Oct-2025
Total Views |
नवी दिल्ली,
voice-to-voice AI model : २५ वर्षीय आयआयटीयनने एआयच्या जगात उल्लेखनीय यश मिळवले आहे. आयआयटी-बीएचयू पदवीधर असलेल्या या व्यक्तीने लुना ही जगातील पहिली भावनिक व्हॉइस-टू-व्हॉइस एआय मॉडेल तयार केली आहे. हे एआय मॉडेल माणसांसारखे गाऊ शकते, बोलताना थांबू शकते आणि अगदी कुजबुज देखील करू शकते. आयआयटी-बीएचयूमधून पदवीधर झालेले इनोव्हेटर स्पर्श अग्रवाल यांनी जयपूरस्थित स्टार्टअप पिक्सा एआयच्या सहकार्याने हे एआय मॉडेल डिझाइन केले आहे.
 
 
AI
 
 
 
लुना म्हणजे काय?
 
पीटीआयच्या अहवालानुसार, हे एआय मॉडेल थेट ऑडिओ प्रक्रिया करू शकते. शिवाय, ते माणसांसारखे भावनिक भाषण निर्माण करू शकते. हे एआय मॉडेल भावनिक संवादासाठी वापरले जाऊ शकते. त्यात स्वर सुधारण्याची, गाण्याची आणि मानवासारख्या अभिव्यक्तींसह संवाद साधण्याची क्षमता आहे.
 
हे एआय मॉडेल चॅटजीपीटी आणि गुगल जेमिनी सारख्या पारंपारिक एआय मॉडेलपेक्षा वेगळे आहे कारण ते केवळ मजकूर-आधारित नाही. ते व्हॉइस कमांडला प्रतिसाद देऊ शकते. सर्वात चांगली गोष्ट म्हणजे तुम्ही या एआय मॉडेलसह तुमच्या भावना माणसांप्रमाणेच शेअर करू शकता. हे एआय मॉडेल अगदी गाऊ शकते.
 
 
 
 
 
 
स्पर्श अग्रवाल यांनी त्यांच्या एक्स हँडलवरून या एआय मॉडेलचा व्हिडिओ शेअर केला. लुना एआय मॉडेलचे वैशिष्ट्य म्हणजे आयआयटी बीएचयूमध्ये शिक्षण घेतलेल्या या नवोन्मेषकाला ते तयार करण्यासाठी मोठ्या कॉर्पोरेट पायाभूत सुविधा किंवा मोठ्या गुंतवणुकीची आवश्यकता नव्हती. हे एआय मॉडेल विकसित करण्यासाठी मोठ्या संशोधन प्रयोगशाळेची आवश्यकता नव्हती, ज्यासाठी १०० दशलक्ष अमेरिकन डॉलर्सची गुंतवणूक आवश्यक होती; त्यासाठी फक्त काही जीपीयू उधार घ्यावे लागले.
 
हे सर्व असूनही, लुना एआय मॉडेल ओपनएआयच्या जीपीटी-४ टीटीएस आणि इलेव्हनलॅब्सच्या मॉडेल्ससारख्या आघाडीच्या सिस्टीमपेक्षा चांगली कामगिरी करू शकते. दोन्ही मॉडेल्सपेक्षा त्याची लेटन्सी ५० टक्क्यांपर्यंत कमी आहे आणि त्याचे स्पीच आउटपुट खूप नैसर्गिक वाटते.