Gemini дегеніміз не: Google ұсынған жаңа AI моделі туралы бәрі

Google өзінің ең қуатты AI моделін шығарды Егіздер. Ол не және ол не істей алады? Біздің мақалада барлығы туралы.

Google көптеген жылдар бойы өзінің AI құралдарын әзірлеп келеді. OpenAI-дан ChatGPT-3 жалпыға ортақ шығарылымымен әлемдегі ең танымал іздеу жүйесін басқаратын компания Bard атты ұқсас құралды да жасады. Бірақ бұл құрал Google рұқсат бере алмайтын бәсекелестерден жеңілді. Сондықтан, жақында дүние жүзі Google-дың жаңа тіл моделі Gemini-ді көруі ғажап емес, ол туралы презентация кезінде білдік.

Ол алпауыттың бұрынғы LLM (Large Language Model) деңгейін жақсарту үшін ғана емес, сонымен қатар мәтінді өңдеу, графика және дыбыс саласында мүлдем жаңа мүмкіндіктерді ұсынуға арналған.

Сонымен, Google Gemini тілінің жаңа үлгісін толығырақ қарастырайық.

Сондай-ақ қызықты: OpenAI Project Q*: бұл не және жоба неге алаңдатады

МАЗМҰНЫ

1. Google Gemini дегеніміз не?

2. Модельді кім жасады?

3. Мүмкіндіктер

4. Әртүрлі нұсқалар бар ма?

5. Gemini-ге қалай кіруге болады?

6. Google Bard-тегі Gemini: не өзгереді?

7. Google Pixel смартфондарындағы Gemini

8. Gemini-нің GPT-4 сияқты басқа AI үлгілерінен айырмашылығы неде?

9. Дәлдік пен бейтараптық туралы алаңдаушылық

10. Болашақ Егіздермен

Google Gemini дегеніміз не?

Бұл мәтінді ғана емес, суреттерді, бейнелерді және аудионы да түсінетін Google жасанды интеллектінің жаңа және қуатты моделі. Бұл мультимодальды модель математика, физика және басқа салалардағы күрделі тапсырмаларды орындау, сонымен қатар әртүрлі бағдарламалау тілдерінде жоғары сапалы кодты түсіну және жасау мүмкіндігі ретінде сипатталған.

Gemini қазіргі уақытта Google Bard және Google Pixel 8 интеграциясы арқылы қол жетімді және бірте-бірте басқа Google қызметтеріне қосылады.

«Егіздер – Google тобының, соның ішінде Google Research-тегі әріптестеріміздің ауқымды бірлескен күш-жігерінің нәтижесі», — деді Деннис Хассабис, бас директор және Google DeepMind негізін қалаушы. «Ол басынан бастап мультимодальды болу үшін жасалған, яғни ол мәтінді, кодты, аудионы, кескіндерді және бейнені қоса алғанда, ақпараттың әртүрлі түрлерін жалпылау және біркелкі түсіну, жұмыс істеу және біріктіру мүмкіндігін білдіреді».

- Жарнама -

Сондай-ақ қызықты: Біз жасанды интеллект деп атайтындардың бәрі шын мәнінде жасанды интеллект емес. Мынаны білу керек

Модельді кім жасады?

Сіз әлдеқашан болжағаныңыздай, Gemini Google және Alphabet, Google компаниясының бас компаниясымен жасалған және компанияның бүгінгі күнге дейін ең озық AI моделі болып табылады. Оның дамуына Google-дың DeepMind бөлімшесі де үлкен үлес қосты. Әзірге әзірлеуге қанша қызметкер қатысқаны және бұл үшін қандай қаражат бөлінгені белгісіз, бірақ Google мүмкіндіктерін біле отырып, өте үлкен сома бар екеніне сенімді бола аламыз.

Сондай-ақ қызықты: Windows 12: Жаңа ОЖ қандай болады

Мүмкіндіктер

Жоғарыда атап өткенімдей, бұл мультимодальды модель, яғни ол мәтінді, кодты, аудионы, кескіндерді және бейнені қоса алғанда әр түрлі деректер түрлерін түсінуге, жұмыс істеуге және біріктіруге болады. Ол алдыңғы AI жүйелерімен салыстырғанда жақсы түсіну, ойлау және кодтау дағдыларын қамтамасыз етеді.

Модельдің негізгі мүмкіндіктері:

Аударма, қорытындылау және диалог сияқты тапсырмалар үшін табиғи тілді өңдеу
Математикалық ойлау және есептер шығару
Код пен құжаттаманы жасау мүмкіндігі
Суреттерді, аудио және бейнені түсіну
Әртүрлі домендерде көп тапсырма

Көріп отырғаныңыздай, мүмкіндіктері басқа модельдерден жоғары.

Тілді түсіну, математикалық ойлау және кодтау сынақтарында Gemini Ultra GPT-4 сияқты үлгілерден асып түсті. Атап айтқанда, бұл 90%-дан астам дәлдікке қол жеткізе отырып, жаппай көп тапсырма тілін түсіну (MMLU) сынағы бойынша адам деңгейіндегі өнімділіктен асып түсетін алғашқы модель.

Үлкен тілдік модельді зерттеудің 32 академиялық сынақтарында Gemini GPT-4-тен асып түсті. 30 жағдайда Google ұсынған жаңа тіл үлгісі бәсекелеске қарағанда жақсы болды. Бұл модельдің тілді толық түсіну қабілетін көрсетеді.

Сондай-ақ оқыңыз: Адам миы жобасы: адам миына еліктеу әрекеті

Әртүрлі нұсқалар бар ма?

Google бұл AI кез келген құрылғыда жұмыс істей алатын икемді модель ретінде сипаттайды: Google деректер орталықтарынан мобильді құрылғыларға дейін. Бұл масштабтауға қол жеткізу үшін Gemini үш нұсқада келеді: Nano, Pro және Ultra.

Егіздердің әртүрлі нұсқалары туралы толығырақ сөйлесейік.

Егіздер Нано: смартфондарда, атап айтқанда Google Pixel 8-де жұмыс істеуге арналған. Ол сыртқы серверлерге қосылмай-ақ жасанды интеллект арқылы тиімді өңдеуді қажет ететін тапсырмаларды орындауға арналған, мысалы, чат бағдарламаларында жауаптар ұсыну немесе мәтінді қорытындылау. Бұл ықшам құрылғы моделінде шамамен 6 миллиард параметр бар.
Егіздер Pro: Google деректер орталықтарында жұмыс істейді. Pro Bard AI чатботының соңғы нұсқасымен жұмыс істеуге арналған. Ол жылдам жауап беру уақытын қамтамасыз ете алады және күрделі сұрауларды түсінеді. Орташа өлшемді модельдің шамамен 100 миллиард параметрі бар және ол Бардтың сөйлесу AI-сының өзегі болып табылады. Pro Google Cloud арқылы қолжетімді болады.
Gemini Ultra: Ultra нұсқасы әлі кеңінен қол жетімді болмаса да, Google оны «үлкен тіл үлгісін (LLM) зерттеуде қолданылатын 30 кеңінен қолданылатын академиялық сынақтардың 32-ы үшін қазіргі заманауи үлгіден асып түсетін оның ең жақсы өнімді моделі ретінде сипаттайды. " Ең үлкен және ең қуатты нұсқа ретінде Ultra 1 триллионнан астам параметрлерді алады. Ол деректер орталықтарында орналасатын болады. Ultra корпоративтік пайдалануға бейімделген. Нұсқа өте күрделі тапсырмаларды орындауға арналған. Google оны ағымдағы сынақ кезеңі аяқталғаннан кейін шығаруды жоспарлап отыр. Яғни, ең қуатты нұсқасы әлі пайдаланушыларға қолжетімді емес.

Сондай-ақ қызықты: Google Bard AI: білуіңіз керек барлық нәрсе

- Жарнама -

Gemini-ге қалай кіруге болады?

Nano және Pro нұсқаларындағы AI енді сәйкесінше Google Pixel 8 смартфондары және Bard чатботы сияқты Google өнімдерінде қолжетімді. Google оны ақырында іздеу жүйесіне, жарнамаға, Gmail электрондық пошта қызметіне, Chrome браузеріне және басқа қызметтерге біріктіруді жоспарлап отыр.

Әзірлеушілер мен кәсіпорын тұтынушылары 13 жылдың 2023 желтоқсанынан бастап Google AI Studio және Google Cloud Vertex AI жүйесіндегі Gemini API арқылы Pro-ға қол жеткізе алады. Әзірлеушілер Android AICore арқылы Nano нұсқасы үлгісіне қол жеткізе алады, ол ертерек қарау кезінде қолжетімді болады.

Сондай-ақ оқыңыз: Samsung Galaxy Flip5 қарсы Motorola Razr 40 Ultra: екі йокозундардың шайқасы

Google Bard-тегі Gemini: не өзгереді?

Тұсаукесер кезінде берілген ақпаратқа сәйкес, модель Google Bard-қа күрделірек мәселелерді шешуге мүмкіндік береді, атап айтқанда:

«Біз Gemini-ді модель табиғи түрде мультимодальды және басынан бастап бірнеше модальділікке алдын ала дайындалған етіп жасадық. Содан кейін өнімділікті жақсарту үшін мультимодальды деректерді қосу арқылы оны нақтыладық. Нәтижесінде, Gemini бұрынғы мультимодальды модельдерге қарағанда әлдеқайда жақсы түсінеді және қорытындылайды және барлық дерлік салаларда заманауи мүмкіндіктерге ие.

Gemini-нің ерекше мультимодальды мүмкіндіктері күрделі мәтіндік және көрнекі ақпаратты түсінуге көмектеседі. Олар үлкен деректер жиынынан нақты ақпаратты алу кезінде әсіресе пайдалы. Бұл модельдің жүздеген мың құжаттардан оларды оқу, сүзу және талдау арқылы ақпараттың мәнін алудың ерекше қабілеті ғылымнан қаржыға дейінгі әртүрлі салалардағы жаңа, найзағай жылдам жаңалықтарға ықпал ететіні сөзсіз».

Тұсаукесер барысында 200 мыңнан астам жазбаларды қамтитын кешенді зерттеу үлгісі көрсетілді, олардың кейбіреулері жаңа деректер бойынша жаңартылуы керек болды. Сіз болжағандай, мұны қолмен жасау өте көп уақытты қажет етеді, сондықтан зерттеу авторлары кірісті қабылдап, қажетті жаңартуларды жасайтын кодты дайындау үшін Gemini пайдаланды. Тағы бір нақты мысал - математика немесе физика мәселелерін түсіндіру үшін Google тіл үлгісін пайдалану.

Мұндағы кіріс деректер мектеп сабағынан тапсырманың фотосы/сканері болды. Жүйе сол жерде сақталған графика мен мәтінді өңдей алды, содан кейін үй тапсырмасының қай бөліктері дұрыс орындалғанын және қайсысы көбірек назар аударуды қажет ететінін көрсете алды. Тұсаукесер пайдаланушы Gemini-ден тапсырманы түсіндіруді бірнеше рет сұрай алатынын көрсетті және әрбір кейінгі әрекетті қарапайым тілде түсіндіру керек. Егіздердің қаншалықты дәл және дұрыс болатынын, әрине, қызығушылық танытқандар тексереді, бірақ мәтінді фотосуреттерден тікелей оқу және өңдеу мүмкіндігі әсерлі. Тұсаукесер барысында қосылған:

«Егіздер бір уақытта мәтінді, кескіндерді, дыбыстарды және т.б. тануға және түсінуге үйретілді. Осының арқасында ол ақпараттың нюанстарын жақсы түсінеді және күрделі сұрақтарға жауап бере алады. Бұл әсіресе математика мен физикаға қатысты тақырыптарды түсіндіруде тиімді, сондықтан ол жеке үй тапсырмасына көмекші бола алады.«.

Google Pixel смартфондарындағы Gemini

Google сонымен қатар Gemini жаңа TPUv5 чипсеттерін «үйренгенін» мақтанды және 2024 жылдың басында Gemini Ultra-ны енгізуді жоспарлап отыр, ол Bard Advanced, гиганттың сөйлеу үлгісінің тұтынушылық нұсқасының жаңа нұсқасын қолданатын болады. Gemini Ultra қазір тестілеуде және қауіпсіздік сарапшыларын таңдау үшін қазірдің өзінде қол жетімді.

Соңғы маңызды ақпарат – Google Pixel 8 смартфондарына Gemini енгізу.Бұл басқалармен қатар, мессенджерлерде Gboard қолданбасы арқылы жылдам жауаптар жасауға мүмкіндік береді. Біріншісі - WhatsApp, бірақ келесі жылы мұндай шешімдер байланысқа қатысты басқа қолданбаларда пайда болады. Дегенмен, бұл тек бастамасы, өйткені Google Pixel 8 смартфондары үшін көптеген жаңа AI құралдарын жариялады және олар болашақта кейбір басқа құрылғыларда қолжетімді болады. Android. Дегенмен, бұл қосымша жоспарлар және әзірге егжей-тегжейлі ақпарат берілмеді.

Gemini-нің GPT-4 сияқты басқа AI үлгілерінен айырмашылығы неде?

Google-дың жаңа Gemini моделі бүгінгі күнге дейін ең үлкен және ең жетілдірілген AI үлгілерінің бірі болып көрінеді, дегенмен Ultra моделінің шығарылымы мұны анық анықтайды. Қазіргі уақытта AI чат-боттарын қолданатын басқа танымал модельдермен салыстырғанда, Gemini өзінің мультимодальды мүмкіндігімен ерекшеленеді, ал GPT-4 сияқты басқа модельдер шынымен мультимодальды болу үшін плагиндер мен интеграцияға сүйенеді.

Дәлдік пен бейтараптық туралы алаңдаушылық

Егіздер жасанды интеллект мүмкіндіктерін дамытуда үлкен секіріс болғанымен, оның басқа негізгі тіл үлгілері сияқты кемшіліктері бар. Ең алдымен, бұл жалған ақпарат жасау мүмкіндігі. Бағалаулар сонымен қатар жаңа тіл үлгісіне қол жетімді оқыту деректеріне негізделген. Сондай-ақ, нақты әлемді түсінудің шектеулі екенін атап өткен жөн. Google жаңа Gemini үлгісі қателіктер жібере алатынын, дәлелдерге негізделмеген және жалпы ойға қайшы келетін фактілерді ұсынуы мүмкін екенін мойындайды.

Әсіресе әлі толық зерттелмеген жаңа мүмкіндіктері бар Gemini Ultra үшін қосымша сынақтар қажет. Google ықтимал зиянды азайту үшін Егіздерді мұқият бағалауды міндеттейді.

Сондай-ақ қызықты: Барлығы туралы Microsoft Копилот: болашақ па, әлде бұрыс жол ма?

Болашақ Егіздермен

Google компаниясының Gemini іске қосуы AI дамуының жаңа дәуірін бастады. Алдыңғы үлгілермен және адамның негізгі көрсеткіштерімен салыстырғанда ең жақсы өнімділігімен Gemini жасанды интеллекттің болашақ мүмкіндіктерін көрсетеді, бірақ әлі де белгілі бір кемшіліктерді жою үшін көбірек зерттеулерді қажет етеді.

Болашақта Gemini Google өнімдерінде көбірек пайдалы және ақылды мүмкіндіктер береді деп күтуге болады. Алдағы уақытта компания Gemini-ді ағылшын тілінен тыс кеңейтуді және оның негізгі үлгі әдіснамасын құруды жоспарлап отыр.

Біз тек қана қарап, Google не істеп жатқанын біледі деп үміттене аламыз.

Сондай-ақ оқыңыз:

Автордан көбірек

Тіркелу

0 Пікірлер

Енгізілген шолулар

Барлық пікірлерді көру

Басқа мақалалар

Gemini дегеніміз не: Google-дың жаңа AI моделі туралы бәрі