28 апреля, 2024

Frant.me

Информационный портал Кузбасса

Все о Google Gemini, ответе Google на ChatGPT

Все о Google Gemini, ответе Google на ChatGPT

Рынок генеративных моделей ИИ в настоящее время представляет собой многолюдное игровое поле. Благодаря чрезвычайно популярным инструментам, таким как ChatGPT и Microsoft Copilot, такой технологический гигант, как Google, не может позволить себе оставаться позади. Ответ Google — Gemini, усовершенствованная языковая модель, способная решать множество задач. Но что именно означают Близнецы? Как его можно использовать? Сможет ли Google превзойти в этом конкурентов?

Если вы пользовались Интернетом в течение последних 12 месяцев, вы, вероятно, сталкивались с термином: генеративный ИИ или искусственный интеллект, с помощью которого вы самостоятельно создаете, проверяете или настраиваете все типы контента. Самый известный пример — ChatGPT, но теперь у нас есть и Google Gemini. Эта модель искусственного интеллекта была разработана исследовательской лабораторией искусственного интеллекта Google под названием Deepmind в сотрудничестве с Google Research. ИИ существует в трех вариантах, о которых мы расскажем ниже.

Читайте также: 5 альтернатив ChatGPT

Это Гугл Близнецы

Прежде всего, Близнецы Ультра, выступающие в роли подставного лица. Таким образом, Google показывает именно то, что компания может предложить, когда речь идет о генеративном искусственном интеллекте. Чуть ниже находится Gemini Pro, версия, которую лучше всего можно охарактеризовать как уменьшенную модель Ultra. Наконец, есть Gemini Nano, версия специально для таких смартфонов, как Гугл Пиксель 8 Про. Google Gemini изначально является мультимедийным, то есть модель работает не только с текстом, но также может обрабатывать аудио, изображения, видео и языки программирования.

Это идет немного дальше, чем вы могли подумать на первый взгляд. Чтобы дать полную картину: Google Gemini в принципе может понимать, редактировать и комбинировать все виды информации. Например, вы можете загрузить фотографию и спросить: «Что происходит на этой фотографии?» Затем Близнецы описывают то, что видно на картинке. А пока вы можете продолжать задавать дополнительные вопросы, пока Близнецы запоминают первое сообщение. Весь этот контекст затем включается в дополнительные вопросы, которые могут дать полную картину проблем, с которыми вы столкнулись. Итак, теперь кажется, что Близнецы могут иметь дело со сложным набором претензий. Благодаря специальному обучению Chatbot текст, изображения, видео и аудио поступают из одного источника.

READ  Qualcomm Snapdragon Spaces разрабатывает очки дополненной реальности

Это уже буквально не так

Теоретически этот метод сбора информации должен создать лучшего чат-бота. Таким образом, Google Gemini может работать более «интуитивно». Если вы попросите его сгенерировать изображение на основе определенных изображений, бот больше не будет воспринимать это буквально (как это часто бывает, при условии, что существует поддержка языка, на котором вы хотите его использовать). «Человек-дерево» в данном случае должен создавать образ не дерева с лицом, а собственно высокого, широкого человека. Создание изображений в текущей версии Gemini пока невозможно, хотя Google в фоновом режиме усердно над этим работает.

Вы также встретите имя Gemini в других цифровых продуктах Google, что может вызвать некоторую путаницу. В конце концов, есть также приложения Gemini, которые работают на мобильных устройствах и в Интернете. Google ранее запускал эту программу под этим названием Гугл это круто, но теперь это должно уступить место названию и продукту Gemini. Что вы заметили в этом как пользователь? Ну, кроме названия, возможно, на практике не так уж и много, потому что вы все еще используете продукты таким же образом. Но технология «за кулисами» другая, поэтому продукты работают лучше.

Различные версии

Хотя такой набор ИИ-сервисов неожиданно кажется очень запутанным, в этом нет ничего странного в подходе Google. Американский рекламный гигант часто предлагает похожие, но принципиально не связанные друг с другом товары и услуги. Однако с помощью Google Gemini вы можете создавать и редактировать множество вещей. Чтобы правильно понять, что предлагает Google Gemini, мы должны рассмотреть варианты, доступные для каждой версии. Однако Gemini предназначен для работы на любом устройстве (типе).

Близнецы Ультра Это самая крупная языковая модель в серии, предназначенная для решения сложных задач. На момент написания Google все еще проводит тесты с Ultra, но модель уже работает лучше, чем, например, ChatGPT-4. Близнецы Про Он обеспечивает баланс между масштабируемостью и производительностью и служит инструментом, позволяющим решать любые задачи. Pro в настоящее время служит основой для чат-бота Google Gemini, ранее известного как Google Bard. По производительности Gemini Pro сравним с ChatGPT-3.5 Turbo.

Тогда у нас есть Google Gemini Nano. Эта версия скоро будет работать на смартфоне, например Pixel. Теоретически это означает, что умный помощник на вашем смартфоне сможет отвечать на вопросы и команды быстрее, чем если бы чат-бот сначала подключился к внешнему серверу. В настоящее время Gemini Nano уже работает на Google Pixel 8 Pro, предоставляя пользователям доступ к интеллектуальным ответам (созданным для вас) при использовании клавиатуры Google. Это еще не работает в Нидерландах (по состоянию на март 2024 г.).

Читайте также: Курс искусственного интеллекта для начинающих: вы можете сделать все это с ChatGPT

Различия между этими версиями

Разница между всеми этими версиями заключается в количестве доступных им параметров. Чем более измеримы значения, тем лучше чат-бот может обрабатывать сложные запросы. К сожалению, Google и другие компании держат карточки, содержащие такую ​​информацию, близко к груди. Если, конечно, эти поставщики не найдут причину поделиться этой информацией. Google Gemini Nano можно использовать как минимум в двух вариантах: один с 1,8 миллиарда, а другой с 3,25 миллиарда различных точек данных.

В настоящее время Google еще не объявил точные цифры относительно количества параметров Gemini Pro и Gemini Ultra. Однако мы можем сделать приблизительную оценку, если посмотрим, что делают конкуренты в настоящее время. Например, ChatGPT-3 имеет 175 миллиардов параметров, а LLaMA 2 (от материнской компании Facebook Meta) приходится довольствоваться максимум 65 миллиардами. Таким образом, в этом отношении ChatGPT опережает LLaMA 2, и мы не можем себе представить, чтобы Google был среди них, но, возможно, компания скоро найдет место, чтобы рассказать нам об этом больше.

READ  Организация экономического сотрудничества и развития более оптимистична в отношении глобального экономического роста.

Где мы встретимся с Google Gemini?

Возможно, вскоре вы сможете использовать собственные приложения Google на базе Google Gemini. Однако ИИ создавался с нуля как основа для других разработчиков, которые могут придать своим продуктам необходимый импульс на основе ИИ. Большим преимуществом по сравнению с конкурентами является то, что эти приложения и услуги можно напрямую интегрировать со многими интернет-сервисами, такими как облака и веб-хостинг. Этим шагом Google хочет выйти на рынок искусственного интеллекта, на котором в основном доминирует OpenAI.

OpenAI — компания, создавшая различные версии ChatGPT. Вы можете делать с ним все что угодно прямо сейчас, например Планирование отпускаТы Создайте своего собственного чат-бота И генерировать изображения. Кроме того, другие компании (например, Microsoft) используют ChatGPT в качестве основы для своих собственных служб искусственного интеллекта. Возьмите этот пример Microsoft второй пилотГде ты сам? Вы также можете создавать изображения, используя его.. Это возможности, которые Google не хочет упустить. Таким образом, вы, возможно, не будете общаться с программным обеспечением напрямую, но вы будете общаться с ним косвенно и в самых разных приложениях.