Root NationЖаңалықтарIT жаңалықтарыМета сөйлейтін AI 4-нан астам ауызекі тілді таниды

Мета сөйлейтін AI 4-нан астам ауызекі тілді таниды

-

Meta ChatGPT клоны емес AI тіл үлгісін жасады. Компанияның жаппай көптілді сөйлеу (MMS) жобасы 4-нан астам ауызекі тілді тани алады және 000-ден астам тілде сөйлеуді (мәтіннен сөйлеуге) жаңғырта алады. Көпшілікке жарияланған AI жобаларының көпшілігі сияқты, Meta бүгін тілдік әртүрлілікті сақтауға көмектесу және зерттеушілерді оны дамытуға ынталандыру үшін MMS ашық қолжетімділікті қамтамасыз етеді. «Бүгін біз зерттеу қауымдастығының басқа мүшелері біздің жұмысымызға сүйенуі үшін үлгілеріміз бен кодтарымызды көпшілік алдында бөлісіп жатырмыз», - деп жазды компания. «Осы жұмыстың арқасында біз әлемнің керемет тілдік әртүрлілігін сақтауға аз да болса үлес қосамыз деп үміттенеміз».

Meta

Сөйлеуді тану және мәтіннен сөйлеуге арналған үлгілер әдетте транскрипция белгілерімен бірге мыңдаған сағаттық аудио жазбалар бойынша жаттығуды қажет етеді. Бірақ өнеркәсібі дамыған елдерде кеңінен қолданылмайтын тілдер үшін - олардың көпшілігі алдағы онжылдықтарда жойылып кету қаупі бар - «бұл деректер жай жоқ», - дейді Мета.

Мета аудиомәліметтерді жинауға дәстүрлі емес тәсілді қолданды: аударылған діни мәтіндердің аудиожазбаларын тыңдау. «Біз көптеген әртүрлі тілдерге аударылған және мәтінге негізделген аударманы зерттеу үшін аудармалары кеңінен зерттелген Киелі кітап сияқты діни мәтіндерге жүгіндік», - деді компания. «Бұл аудармаларда осы мәтіндерді әртүрлі тілдерде оқитын адамдардың жалпыға қолжетімді аудио жазбалары бар». Мета зерттеушілері Киелі кітаптағы белгіленбеген жазбаларды және ұқсас мәтіндерді қосу арқылы модельге қол жетімді тілдердің санын 4-нан астамға дейін арттырды.

«Аудио жазбалардың мазмұны діни сипатта болғанымен, біздің талдауымыз бұл модельдің көбірек діни тілді шығаруына әсер етпейтінін көрсетті», - деп жазады Мета. «Біз бұл байланыстырушы уақытша жіктеу (CTC) әдісін қолданатындықтан деп есептейміз, ол үлкен тіл үлгілерімен (LLM) немесе сөйлеуді тану үшін реттілік үлгілерімен салыстырғанда әлдеқайда шектеулі». Сондай-ақ, діни мәтіндердің көпшілігін ер адамдар оқитынына қарамастан, бұл ерлердің көзқарасын тудырмады - жүйе әйелдер мен ерлердің дауыстарын бірдей жақсы таниды.

Деректерді қолдануға ыңғайлы ету үшін теңестіру үлгісін үйреткеннен кейін, Meta таңбаланбаған деректер бойынша үйренуге болатын компанияның «өздігінен бақыланатын тілді көрсетуді үйрену» моделі wav2vec 2.0 қолданды. Дәстүрлі емес деректер көздері мен өздігінен басқарылатын сөйлеу үлгісінің үйлесімі әсерлі нәтижелерге әкелді. «Біздің нәтижелер жаппай көптілді хабар тарату үлгілері бар үлгілермен салыстырғанда жақсы жұмыс істейтінін және 10 есе көп тілді қамтитынын көрсетті». Атап айтқанда, Meta MMS-ті OpenAI's Whisper-мен салыстырды және нәтиже күткеннен асып түсті. «Біз жаппай көптілді сөйлеу деректерінде оқытылатын үлгілерде сөз қателерінің жарты пайызы болатынын анықтадық, бірақ жаппай көптілді сөйлеу 11 есе көп тілді қамтиды».

Мета оның жаңа үлгілері мінсіз емес екенін ескертеді. «Мәселен, сөйлеуден мәтінге модель жеке сөздерді немесе сөз тіркестерін қате аударуы мүмкін», - деп жазады компания. «Нәтижеге байланысты бұл қорлайтын және/немесе дұрыс емес тілге әкелуі мүмкін. Біз AI қоғамдастығы аясындағы ынтымақтастық AI технологияларының жауапты дамуы үшін өте маңызды деп санаймыз».

Meta

Енді Meta ашық бастапқы зерттеулер үшін MMS шығарды, ол әлемдегі тілдердің санын 100 немесе одан да азға дейін азайту тенденциясын өзгертуге үміттенеді, олардың көпшілігі негізгі технологиялармен қамтамасыз етіледі. Ол көмекші технологиялар, TTS және тіпті VR / AR технологиялары барлығына ана тілінде сөйлеуге және үйренуге мүмкіндік беретін әлемді көреді. Онда: «Біз адамдарды ана тілінде сөйлей отырып, ақпаратқа қол жеткізе алатын және технологияны пайдалана алатындықтан, өз тілдерін сақтауға шақыратын, керісінше әсер ететін әлемді елестетеміз» делінген.

Сондай-ақ оқыңыз:

ДжерелоEngadget
Тіркелу
туралы хабарлау
қонақ

0 Пікірлер
Енгізілген шолулар
Барлық пікірлерді көру
Жаңартуларға жазылыңыз