OpenAI демонстрирует искусственный интеллект, преобразующий текст в речь, который может имитировать голос после 15 секунд аудио - IT Pro

OpenAI создала инструмент, который может имитировать звук на основе пятнадцатисекундного сегмента. Компания выпустила образцы аудиодвижка, но не хочет сразу выпускать всю модель.

OpenAI, компания, занимающаяся искусственным интеллектом, которая также производит ChatGPT, Он описывает инструмент в сообщении в блоге.. Модель называется Voice Engine и может читать тексты, которые пользователь предоставляет в качестве текстового ввода. На основе образца голоса OpenAI утверждает, что ИИ может идеально имитировать голос, включая тон и эмоции. Компания заявляет, что такой сегмент должен длиться всего пятнадцать секунд.

Компания не раскрывает никаких данных об инструменте, а также отсутствует официальный документ или другое техническое описание. Так, например, непонятно, на каких аудиоклипах обучался Voice Engine. говорит OpenAI В TechCrunch Они относятся к сочетанию лицензированных и общедоступных данных. По заявлению компании, Voice Engine не обучается на пользовательских данных. Образцы, которые пользователи создают позже, также удаляются.

По мнению TechCrunch, в будущем инструмент должен стоить денег, хотя OpenAI публично об этом ничего не говорит. Согласно документам, компания будет взимать 15 долларов за миллион символов, или около 160 000 произносимых слов.

Voice Engine пока недоступен пользователям, как это часто бывает с аналогичными сервисами в наши дни. В прошлом году Meta показала, что Voicebox также может генерировать устный текст на основе коротких аудиофайлов, но компания также не делает этот инструмент доступным. OpenAI заявляет, что сейчас также относится к этому с осторожностью из-за последствий. Инструментом можно быстро злоупотребить. OpenAI конкретно относится к Соединенным Штатам, где в конце этого года пройдут президентские выборы и сейчас началась избирательная борьба.

Компания разместила в блоге ряд примеров, показывающих, на что способен этот инструмент. Кроме того, OpenAI тестирует Voice Engine с участием ограниченного числа тестировщиков. Им пришлось заранее подписать заявление о том, что они не будут создавать тексты без разрешения заинтересованного лица. Инструмент также будет иметь водяной знак, показывающий, что звук был создан, и OpenAI заявляет, что «активно отслеживает» использование системы. Когда инструмент будет выпущен в будущем, OpenAI также хочет создать список звуков, которые не следует клонировать.

READ Дорожные штрафы в размере 324 000 евро менее чем за три года в Де Лейне: сколько водители платят сами, зависит от их провинции | интерьер

Yuliana Koroleva

«Создатель. Дружелюбный к хипстерам социальный медиа-голик. Интернет-фанат. Страстный фанатик алкоголя».

OpenAI демонстрирует искусственный интеллект, преобразующий текст в речь, который может имитировать голос после 15 секунд аудио — IT Pro — Новости

Еще 27 банкротств в регионе Антверпена

Сектор недвижимости и строительства предупреждает о беспрецедентном жилищном кризисе: «Доступное жилье скоро станет невозможным».

Рено Сомбиоз 2024: Каптур XXL

Тесса и Дэн превращают Stani’s Café в кафе-сервис: «Классические блюда в новом, свежем виде с небольшим количеством масла»

«Оно распространилось, и вся моя голова была забита».

Вестерло и СТВВ позволили ВАР поработать в овертайме при сбалансированной ничьей

Resident Evil 9 скоро будет анонсирован и выйдет в 2025 году.

Добавить комментарий Отменить ответ

More Stories