मायक्रोसॉफ्टने एमयू, एक नवीन कृत्रिम बुद्धिमत्ता (एआय) मॉडेल सादर केले आहे जे डिव्हाइसवर स्थानिक पातळीवर चालू शकते. गेल्या आठवड्यात, रेडमंड-आधारित टेक राक्षसाने बीटामध्ये नवीन विंडोज 11 वैशिष्ट्ये जारी केली, त्यापैकी सेटिंग्जमध्ये नवीन एआय एजंट वैशिष्ट्य होते. हे वैशिष्ट्य वापरकर्त्यांना सेटिंग्ज मेनूमध्ये काय करायचे आहे त्याचे वर्णन करण्यास अनुमती देते आणि एआय एजंट्स एकतर पर्यायावर नेव्हिगेट करण्यासाठी किंवा स्वायत्तपणे कृती करण्यासाठी वापरते. कंपनीने आता पुष्टी केली आहे की हे वैशिष्ट्य एमयू स्मॉल लँग्वेज मॉडेल (एसएलएम) द्वारे समर्थित आहे.
मायक्रोसॉफ्टची एमयू एआय मॉडेल विंडोज सेटिंग्जमध्ये एजंट्स एजंट्स
मध्ये मध्ये ब्लॉग पोस्टटेक राक्षसाने त्याच्या नवीन एआय मॉडेलचे तपशीलवार वर्णन केले. हे सध्या सुसंगत कोपिलोट+ पीसीमध्ये संपूर्णपणे ऑन-डिव्हाइस तैनात केले आहे आणि ते डिव्हाइसच्या न्यूरल प्रोसेसिंग युनिट (एनपीयू) वर चालते. मायक्रोसॉफ्टने मॉडेलच्या ऑप्टिमायझेशन आणि विलंब यावर काम केले आहे आणि असा दावा केला आहे की “सेटिंग्जच्या परिस्थितीत एजंटच्या यूएक्स आवश्यकता” पूर्ण करण्यासाठी प्रति सेकंदापेक्षा जास्त टोकनवर तो प्रतिसाद देतो.
एमयू ट्रान्सफॉर्मर-आधारित एन्कोडर-डेकोडर आर्किटेक्चरवर तयार केले गेले आहे ज्यामध्ये 3030० दशलक्ष टोकन पॅरामीटर्स आहेत, ज्यामुळे एसएलएमला छोट्या प्रमाणात तैनातीसाठी चांगले फिट होते. अशा आर्किटेक्चरमध्ये, एन्कोडर प्रथम इनपुटला सुवाच्य निश्चित-लांबीच्या प्रतिनिधित्वामध्ये रूपांतरित करते, ज्याचे नंतर डीकोडरद्वारे विश्लेषण केले जाते, जे आउटपुट देखील व्युत्पन्न करते.
मायक्रोसॉफ्टने म्हटले आहे की उच्च कार्यक्षमता आणि ऑप्टिमायझेशनमुळे या आर्किटेक्चरला प्राधान्य दिले गेले आहे, जे मर्यादित संगणकीय बँडविड्थसह कार्य करताना आवश्यक आहे. ते एनपीयूच्या निर्बंधासह संरेखित ठेवण्यासाठी, कंपनीने एन्कोडर आणि डिकोडर दरम्यान थर परिमाण आणि ऑप्टिमाइझ केलेले पॅरामीटर वितरण देखील निवडले.
कंपनीच्या पीएचआय मॉडेल्समधून डिस्टिल्ड, एमयूला अझर मशीन लर्निंगवर ए 100 जीपीयू वापरून प्रशिक्षण दिले गेले. थोडक्यात, डिस्टिल्ड मॉडेल्स मूळ मॉडेलच्या तुलनेत उच्च कार्यक्षमता दर्शवितात. मायक्रोसॉफ्टने मॉडेलला टास्क-विशिष्ट डेटा आणि लो-रँक अॅडॉप्टेशन (एलओआरए) पद्धतींद्वारे फाईन-ट्यूनिंगसह मॉडेल जोडून आपली कार्यक्षमता सुधारली. विशेष म्हणजे, कंपनीचा असा दावा आहे की एमयू दहावा आकारात असूनही पीएचआय -3.5-मिनी सारख्याच स्तरावर कामगिरी करतो.
विंडोज सेटिंग्जसाठी एमयू ऑप्टिमाइझिंग
मॉडेल सेटिंग्जमध्ये एआय एजंट्सला उर्जा देण्यापूर्वी टेक राक्षसला आणखी एक समस्या सोडवावी लागली – शेकडो सिस्टम सेटिंग्ज बदलण्यासाठी इनपुट आणि आउटपुट टोकन हाताळण्यास सक्षम असणे आवश्यक आहे. यासाठी केवळ एक विशाल ज्ञान नेटवर्कच नाही तर जवळजवळ त्वरित कार्ये पूर्ण करण्यासाठी कमी विलंब देखील आवश्यक आहे.
म्हणूनच, मायक्रोसॉफ्टने आपला प्रशिक्षण डेटा मोठ्या प्रमाणात मोजला, 50 सेटिंग्जमधून शेकडो पर्यंत जाऊन एआयला शिकवण्यासाठी सिंथेटिक लेबलिंग आणि ध्वनी इंजेक्शन सारख्या तंत्रांचा वापर केला. 6.6 दशलक्षाहून अधिक उदाहरणांसह प्रशिक्षण घेतल्यानंतर मॉडेल अर्ध्या सेकंदाखाली प्रतिसाद देण्यासाठी वेगवान आणि अचूक झाला, असे कंपनीने दावा केला.
एक महत्त्वाचे आव्हान होते की एमयूने लहान किंवा अस्पष्ट वाक्यांशांवर बहु-शब्दांच्या क्वेरीसह चांगले प्रदर्शन केले. उदाहरणार्थ, “रात्री लोअर स्क्रीन ब्राइटनेस” टाइप केल्याने फक्त “ब्राइटनेस” टाइप करण्यापेक्षा अधिक संदर्भ मिळतो. हे सोडविण्यासाठी, जेव्हा क्वेरी खूपच अस्पष्ट होते तेव्हा मायक्रोसॉफ्ट पारंपारिक कीवर्ड-आधारित शोध परिणाम दर्शवितो.
मायक्रोसॉफ्टने भाषा-आधारित अंतर देखील पाहिले. उदाहरणार्थ जेव्हा एखादी सेटिंग एकाच कार्यक्षमतेपेक्षा जास्त लागू शकते (उदाहरणार्थ, “ब्राइटनेस वाढवा” डिव्हाइसच्या स्क्रीन किंवा बाह्य मॉनिटरचा संदर्भ घेऊ शकते). या अंतर सोडविण्यासाठी, एआय मॉडेल सध्या सर्वात सामान्यपणे वापरल्या जाणार्या सेटिंग्जवर लक्ष केंद्रित करते. टेक राक्षस परिष्कृत करणे हेच काहीतरी आहे.