Root NationЖаңалықтарIT жаңалықтарыMicrosoft адам деңгейіндегі AI-ға жол ашатын мультимодальды тәсілді ұсынды

Microsoft адам деңгейіндегі AI-ға жол ашатын мультимодальды тәсілді ұсынды

-

Осы аптаның басында зерттеушілер Microsoft Kosmos-1 мультимодальды жасанды интеллект моделін ұсынды, ол мазмұн үшін кескіндерді талдай алады, визуалды басқатырғыштарды шеше алады, мәтінді көрнекі тануды орындай алады, визуалды IQ тесттерін тапсырады және табиғи тіл нұсқауларын түсінеді. Зерттеушілердің пікірінше, мұндай AI модельдері адам деңгейіндегі бірлескен тапсырмаларды орындай алатын жасанды жалпы интеллект (AI) құру жолындағы алғашқы қадам болып табылады. Яғни, бұл технология кез келген интеллектуалдық тапсырмада адамды алмастыра алады. Бұл негізгі іскер серіктес болып табылатын OpenAI-дің алға қойған мақсаты Microsoft жасанды интеллект саласында.

Космос-1

Бұл жағдайда Космос-1 компанияның таза жеке дамуы болып табылады Microsoft. Зерттеушілер олардың жасалуын «көп модальды кең тіл үлгісі» (MLLM) деп атайды, өйткені оның тамыры ChatGPT сияқты LLM сияқты тек мәтінді табиғи тілді өңдеуде жатыр. Модель кіріс кескіндерін қабылдау үшін зерттеушілер алдымен суреттерді LLM түсінетін белгілердің арнайы сериясына (негізінен мәтін) түрлендіруі керек.

Космос-1

Космос-1 The Pile (800 ГБ ағылшын мәтіндік ресурсы) және Common Crawl үзінділерін қоса алғанда, Интернеттен алынған дерекқорда оқытылды. Содан кейін модель сөйлеуді түсінуге, сөйлеуді генерациялауға, таңбаларды оптикалық танусыз мәтінді жіктеуге, суретке жазуға, визуалды сұрақтарға жауап беруге, веб-беттегі сұрақтарға жауап беруге және локализациямен кескінді жіктеуге арналған бірнеше сынақтармен сыналды. Сәйкес Microsoft, Космос-1 осы сынақтардың көпшілігінде қазіргі үлгілерден асып түсті.

Космос-1

Фигуралар тізбегін ұсыну және субъектіден тізбекті аяқтауды сұрайтын визуалды IQ деңгейін өлшейтін Raven's Progressive Reading тесті әсіресе қызықты болды. Космос-1 22% жағдайда дұрыс жауап бере алды.

Космос-1

Болашақта оңтайландырумен бірге бұл алғашқы қадамдар бұдан да маңызды нәтижелер бере алады, бұл AI үлгілеріне медианың кез келген түрін қабылдауға және әсер етуге мүмкіндік береді, жасанды көмекшілердің мүмкіндіктерін айтарлықтай кеңейтеді.

Сондай-ақ оқыңыз:

Джерелоарстехника
Тіркелу
туралы хабарлау
қонақ

0 Пікірлер
Енгізілген шолулар
Барлық пікірлерді көру
Жаңартуларға жазылыңыз