
OpenAI объявила об альфа-релизе Расширенный голосовой режим ChatGPT, питаться отинновационная модель GPT-4o. Эта революционная функция, которая обещает обеспечить гиперреалистичные звуковые ответы, начиная с сегодняшнего дня, первоначально будет доступен небольшой группе пользователей ChatGPT Plus с целью расширения доступности для всех подписчиков Plus. к осени 2024 г..
Голосовой режим: голосовой режим ChatGPT является официальным.
Презентация голосового режима с GPT-4o, состоявшаяся в мае, вызвала большой интерес и восхищение у публики, благодаря своему невероятная скорость генерации и поразительное сходство с реальным человеческим голосом, которое вызвало сравнения с голосом знаменитой актрисы Скарлетт Йоханссон.
OpenAI отрицает, что использовала голос актрисы, впоследствии удалив его из демо-версии и объявив в июне отложить выпуск расширенного голосового режима для улучшения мер безопасности.
В этой альфа-фазе некоторые функции, представленные во время весеннего обновления, такие как видео и совместное использование экрана, не будут включены и будут представлены позже. Тем не менее, избранная группа премиум-пользователей будет иметь доступ к голосовой функции ChatGPT, представленной в демо-версии.
См. также: SearchGPT: что такое поисковая система OpenAI и как она работает
Режим Advanced Voice отличается от аудиорешения, предлагаемого в настоящее время ChatGPT, которое основано на трех различных моделях. ГПТ-4о, благодаря его природа мультимодальный, способен обрабатывать эти задачи, не прибегая к вспомогательным моделям, генерируя голосовые ответы с помощью одного Значительно уменьшена задержка. Кроме того, OpenAI подчеркивает способность GPT-4o воспринимать эмоциональные нюансы голоса, такие как печаль и волнение, а также распознавать пение.
Чтобы обеспечить тщательный мониторинг использования голоса ChatGPT, OpenAI выбрала постепенное освобождение. Участники программы Alpha получат уведомление в приложении ChatGPT, а затем электронное письмо с инструкциями по использованию этой функции.
Вокальные возможности GPT-4o они протестированы на 45 языках, демонстрируя стремление OpenAI сделать эту технологию доступной для широкой международной аудитории. Кроме того, компания внедрила новые фильтры для запретить запросы на создание музыки или другой аудиоматериал, защищенный авторским правом, тем самым защищая интеллектуальную собственность.
Расширенный голосовой режим ChatGPT изначально будет ограничен четыре предустановленных голоса от ChatGPT: Juniper, Breeze, Cove и Ember, созданные в сотрудничестве с профессиональными актерами озвучивания. ChatGPT не сможет имитировать голоса других людей и будет блокировать любой вывод, отличающийся от голосов по умолчанию, обеспечивая тем самым этичное и ответственное использование технологии.





