Root NationЖаңалықтарIT жаңалықтарыAI суреті өзінің гуманоидты AI роботының жаңа дағдыларын көрсетті

AI суреті өзінің гуманоидты AI роботының жаңа дағдыларын көрсетті

-

Гуманоидты роботтардың дамуы екі онжылдықтың жақсы бөлігінде баяу қарқынмен жүрді, бірақ соңғы уақытта біз бұл салада көбірек серпілістерді байқадық. Жақында жазғанымыздай, AI роботы MWC 2024 көрмесінде таныстырылды Амекажәне тағы бір даму, Unitree H1, адам тәрізді роботтар арасындағы жылдамдық рекордын жаңартты. Енді Интернетте AI және OpenAI компанияларының ынтымақтастығының керемет нәтижесі пайда болды - қазір адамдармен сөйлесе алатын гуманоид роботтың таңғаларлық бейнесі.

Сурет AI және OpenAI AI бар жаңа гуманоидты роботты ұсынды

Startup Figure AI жаңа Visual Language Model (VLM) арқылы жұмыс істейтін 01-сурет роботын көрсететін бейнені шығарды. Онда 01-сурет табақ, алма және кесе тұрған үстелде тұр. Сол жақта кептіргіш бар. Ал адамның алдынан робот не көреді деген сұраққа үстел үстінде жатқанның барлығын егжей-тегжейлі сипаттау арқылы жауап береді.

Содан кейін адам бірдеңе жеуге бола ма деп сұрайды, робот: «Әрине», - деп жауап береді, содан кейін епті тегіс қимылмен алманы алып, адамға береді. Осыдан кейін тағы бір таңғаларлық демонстрация келеді – ер адам 01-суреттің алдына себеттен мыжылған қоқысты төгіп, роботтан неліктен бұлай істегенін түсіндіруін сұрайды, сонымен бірге қоқысты себетке жинайды. Ал «ойын» қағазды қоқыс жәшігіне қайта салып жатып түсіндіреді. «Сондықтан мен сізге алма бердім, өйткені бұл мен сізге үстелден бере алатын жалғыз жеуге болатын нәрсе», - деді робот.

Компания өкілдері 01-суретте алдын ала дайындалған мультимодальды модель қолданылғанын түсіндірді OpenAI, VLM, кескіндер мен мәтіндерді түсіну үшін және жауаптарын жасау үшін дауыстық шақыруларға сүйенеді. Бұл, айталық, жазбаша сұрауларға бағытталған OpenAI-дің GPT-4 нұсқасынан ерекшеленеді.

Ол сондай-ақ компания «үйренілген төмен деңгейлі бимануальды манипуляциялар» деп атайтын нәрсені пайдаланады. Жүйе қозғалысты басқаруға арналған нейрондық желісімен кескінді дәл калибрлеуді (пиксель деңгейіне дейін) үйлестіреді. «Бұл желілер 10 Гц жиілікте кескіндерді қабылдайды және 24 Гц жиілікте 200-DOF әрекеттерін (білек позалары мен саусақ буындарының бұрыштары) жасайды», - деді AI суреті мәлімдемесінде.

Компания бейнедегі әрбір мінез-құлық жүйелік оқытуға негізделген деп мәлімдейді, сондықтан сахнаның артында ешкім 01-суреттің жолын тартпайды. Әрине, бір нюанс бар - робот бұл процедурадан қанша рет өткені белгісіз. Мүмкін, бұл оның дәл қимылдарын түсіндіретін жүзінші рет болды. Бірақ кез келген жағдайда, бұл жетістік әсерлі және аздап фантастикалық көрінеді.

Сондай-ақ оқыңыз:

Джерелоtechradar
Тіркелу
туралы хабарлау
қонақ

0 Пікірлер
Енгізілген шолулар
Барлық пікірлерді көру