OpenAI представила безкоштовну платформу для озвучування текстів на різних мовах

Компанія OpenAI, відома завдяки створенню ChatGPT, радісно повідомила про запуск нового покоління голосових моделей, які здатні перетворювати текст в мовлення і навпаки. У компанії акцентують увагу на тому, що ці моделі побудовані на базі найсучасніших алгоритмів машинного навчання.

Ця система надає можливість не лише озвучувати текст, а й детально налаштовувати голос, змінюючи інтонацію, тембр, емоційне забарвлення та стиль подачі. Наприклад, штучний інтелект може “говорити” голосом пірата або оповідача казок. Більш того, користувачі можуть задати власні інструкції для ще точнішого налаштування своїх аудіорозповідей.

Крім того, OpenAI покращила технологію розпізнавання мовлення. Нові моделі gpt-4o-transcribe та gpt-4o-mini-transcribe демонструють високий рівень точності перетворення мовлення в текст, навіть в умовах, які здаються складними, таких як сильний акцент, фоновий шум або різна швидкість мовлення.

Головна мета цієї розробки — зробити взаємодію зі штучним інтелектом максимально природною та подібною до живого спілкування. Оновлені голосові моделі без проблем інтегруються в різні додатки та сервіси.

Зараз нові можливості вже доступні для розробників через API, а всі бажаючі можуть випробувати їх на спеціальній демонстраційній платформі.

Підпишись на нас в Google НОВИНИ, та отримуй більше свіжих новин!

Читайте також