OpenAI обновила модели ИИ для транскрипции и генерации голоса / фото Dall-E

Разработчик ChatGPT OpenAI представил голосовые модели нового поколения для преобразования текста в речь и обратно. В компании говорят, что эти модели основаны на "передовых алгоритмах машинного обучения".

Система позволяет не только конвертировать текст в речь, но и настраивать как сам голос, так и его стиль звучания, тембр и эмоциональность. Например, можно заставить модель говорить "как пират" или рассказчик детских сказок. Доступны пресеты, однако есть и возможность вводить инструкции вручную.

Помимо этого, OpenAI улучшила свою технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe допускают меньше ошибок при преобразовании речи в текст даже в сложных условиях, таких как сильный акцент, шумная обстановка и разная скорость речи.

Видео дня

Разработка ориентирована на повышение интуитивности взаимодействия с ИИ, делая его более интуитивным и приближенным к реальному общению. Обновленные голосовые модели можно легко интегрировать в различные приложения и сервисы.

Новые модели уже доступно разработчикам через API, также есть возможность протестировать его на специальном сайте всем желающим.

OpenAI запустил сайт, на котором можно бесплатно озвучить любой текст – даже на украинском

Ранее СМИ узнали, что OpenAI планирует взимать до 1 миллиона гривен в месяц за доступ к самому мощному и передовому ИИ. Такие модели буду нацелены на поддержку "исследований уровня доктора наук".

Далее в планах у OpenAI выпуск GPT-5. Ожидается, что это будет не просто новая языковая модель, а революция в мире ИИ. Она будет способна изучить любую задачу, которые люди смогут придумать. Это сделает ее неотличимым от человека.

Вас также могут заинтересовать новости: