Google обяви новата версия на своя флагмански AI модел, наречен Gemini 2. Този модел е проектиран да изпълнява задачи на компютрите на потребителите и в уеб пространството, като общува като човек и разбира физическия свят като виртуален асистент.
Главният изпълнителен директор на Google DeepMind Демис Хасабис, сподели пред WIRED, че мечтае за универсален цифров асистент от дълго време, като важна стъпка към общия изкуствен интелект (AGI). Новият модел Gemini 2 притежава усъвършенствани мултимодални способности, което означава, че е по-умел в разчитането на видео и аудио, както и в комуникацията на реч.
Според изпълнителния директор на Google Сундар Пичай, моделите с агентски характеристики могат да разбират повече за света около нас, да мислят няколко стъпки напред и да предприемат действия от името на потребителя, под негово наблюдение. Така наречените AI агенти се разглеждат като следващата голяма стъпка в технологиите, способни да извършват задачи като резервации на полети, организиране на срещи и анализиране на документи.
Google демонстрира възможностите на Gemini 2 чрез два специализирани AI агента – единият за програмиране, а другият за анализ на данни. Вместо да попълват части от код, тези агенти могат да изпълняват по-сложни задачи като записване на код в хранилища или комбиниране на данни за анализ.
Компанията представи и Project Mariner, експериментално разширение за Chrome, което може да поеме уеб навигацията за изпълнение на полезни задачи. Например, агентът може да помогне с планиране на храна, като влезе в акаунт на потребителя в супермаркет и добави необходимите продукти в количката.
Стартирал през декември 2023 г., Gemini е част от усилията на Google да настигне OpenAI, компанията зад популярния чатбот ChatGPT. С новите си модели, Google предлага чатбот, който е също толкова способен, колкото и ChatGPT, като добавя генеративен AI за търсене и други продукти.
Проектът Astra е още една нова версия, която позволява на Gemini 2 да разбере заобикалящата го среда чрез смартфон камера и да разговаря естествено с човешки глас за това, което вижда. В офисите на Google DeepMind, Gemini 2 демонстрира способността си да оценява винени бутилки, предоставяйки информация за географско произход, вкусови характеристики и цени.
“Една от целите ми за Astra е да бъде най-добрата система за препоръки” – сподели Хасабис. Чрез Astra, Gemini 2 може не само да търси информация, свързана със заобикалящата го среда, а и да запомня предпочитанията на потребителя.