22 ноября, 2024

Frant.me

Информационный портал Кузбасса

OpenAI объявляет о модели GPT-4, которая может использовать изображения и текст в качестве входных данных — IT Pro — Новости

OpenAI анонсировала последнюю версию языковой парадигмы GPT — GPT-4. Основное нововведение новой версии заключается в том, что в качестве входных данных могут выступать текст и изображения. Языковая модель GPT формирует основу для интеллектуальных чат-ботов, таких как ChatGPT и новый Bing.

OpenAI выделен GPT-4 принимает изображения и текст для генерации текста в качестве вывода. По данным компании, новая модель менее способна, чем люди, во многих реальных ситуациях, но она демонстрирует производительность GPT-4 на уровне человека в нескольких профессиональных и академических тестах.

Предыдущая версия, GPT-3.5, принимала на вход только текст. В случайных, случайных разговорах различия между GPT-3.5 и GPT-4.0 могут быть едва уловимыми. OpenAI утверждает, что различия действительно проявляются только тогда, когда задача достигает или превышает определенный уровень сложности. По сравнению с GPT-3.5, GPT-4 считается более надежным, более креативным и способным обрабатывать более детальные инструкции.

OpenAI показывает несколько примеров возможностей GPT-4, когда задается текстовый вопрос о прикрепленном изображении. Есть много примеров, когда модель просят объяснить, что смешного на картинке.

По данным OpenAI, на корректировку производительности последней версии ушло шесть месяцев. Год назад GPT-3.5 был обучен в качестве первой тестовой сессии для новой системы. Ошибки и теоретические основы также были улучшены. Соответственно, тестовая сессия GPT-4 отличалась «беспрецедентной стабильностью», говорит OpenAI. По словам компании, эта новая версия станет первой языковой моделью OpenAI, эффективность обучения которой можно точно и заранее предсказать.

Возможность ввода текста в GPT-4 реализована через ChatGPT и API для новой модели, где Список ожидания до. Чтобы сделать возможность ввода изображений более доступной, OpenAI в настоящее время работает с одним партнером, а именно будь моими глазами. Это мобильное приложение, чтобы сделать мир доступным для слепых и слабовидящих.

READ  Microsoft прекращает продажу лицензий Windows 10