3 октября, 2024

Frant.me

Информационный портал Кузбасса

OpenAI демонстрирует искусственный интеллект, преобразующий текст в речь, который может имитировать голос после 15 секунд аудио — IT Pro — Новости

OpenAI создала инструмент, который может имитировать звук на основе пятнадцатисекундного сегмента. Компания выпустила образцы аудиодвижка, но не хочет сразу выпускать всю модель.

OpenAI, компания, занимающаяся искусственным интеллектом, которая также производит ChatGPT, Он описывает инструмент в сообщении в блоге.. Модель называется Voice Engine и может читать тексты, которые пользователь предоставляет в качестве текстового ввода. На основе образца голоса OpenAI утверждает, что ИИ может идеально имитировать голос, включая тон и эмоции. Компания заявляет, что такой сегмент должен длиться всего пятнадцать секунд.

Компания не раскрывает никаких данных об инструменте, а также отсутствует официальный документ или другое техническое описание. Так, например, непонятно, на каких аудиоклипах обучался Voice Engine. говорит OpenAI В TechCrunch Они относятся к сочетанию лицензированных и общедоступных данных. По заявлению компании, Voice Engine не обучается на пользовательских данных. Образцы, которые пользователи создают позже, также удаляются.

По мнению TechCrunch, в будущем инструмент должен стоить денег, хотя OpenAI публично об этом ничего не говорит. Согласно документам, компания будет взимать 15 долларов за миллион символов, или около 160 000 произносимых слов.

Voice Engine пока недоступен пользователям, как это часто бывает с аналогичными сервисами в наши дни. В прошлом году Meta показала, что Voicebox также может генерировать устный текст на основе коротких аудиофайлов, но компания также не делает этот инструмент доступным. OpenAI заявляет, что сейчас также относится к этому с осторожностью из-за последствий. Инструментом можно быстро злоупотребить. OpenAI конкретно относится к Соединенным Штатам, где в конце этого года пройдут президентские выборы и сейчас началась избирательная борьба.

Компания разместила в блоге ряд примеров, показывающих, на что способен этот инструмент. Кроме того, OpenAI тестирует Voice Engine с участием ограниченного числа тестировщиков. Им пришлось заранее подписать заявление о том, что они не будут создавать тексты без разрешения заинтересованного лица. Инструмент также будет иметь водяной знак, показывающий, что звук был создан, и OpenAI заявляет, что «активно отслеживает» использование системы. Когда инструмент будет выпущен в будущем, OpenAI также хочет создать список звуков, которые не следует клонировать.

READ  Французская студентка (21 год), пострадавшая в поезде: жертва, которая не видела и не слышала поезд через наушники и шарф