
Разработчик ChatGPT OpenAI представил голосовые модели нового поколения для преобразования текста в речь и обратно. В компании говорят, что эти модели основаны на "передовых алгоритмах машинного обучения".
Система позволяет не только конвертировать текст в речь, но и настраивать как сам голос, так и его стиль звучания, тембр и эмоциональность. Например, можно заставить модель говорить "как пират" или рассказчик детских сказок. Доступны пресеты, однако есть и возможность вводить инструкции вручную.
Помимо этого, OpenAI улучшила свою технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe допускают меньше ошибок при преобразовании речи в текст даже в сложных условиях, таких как сильный акцент, шумная обстановка и разная скорость речи.
Разработка ориентирована на повышение интуитивности взаимодействия с ИИ, делая его более интуитивным и приближенным к реальному общению. Обновленные голосовые модели можно легко интегрировать в различные приложения и сервисы.
Новые модели уже доступно разработчикам через API, также есть возможность протестировать его на специальном сайте всем желающим.

Ранее СМИ узнали, что OpenAI планирует взимать до 1 миллиона гривен в месяц за доступ к самому мощному и передовому ИИ. Такие модели буду нацелены на поддержку "исследований уровня доктора наук".
Далее в планах у OpenAI выпуск GPT-5. Ожидается, что это будет не просто новая языковая модель, а революция в мире ИИ. Она будет способна изучить любую задачу, которые люди смогут придумать. Это сделает ее неотличимым от человека.