Компанія OpenAI, відома завдяки створенню ChatGPT, радісно повідомила про запуск нового покоління голосових моделей, які здатні перетворювати текст в мовлення і навпаки. У компанії акцентують увагу на тому, що ці моделі побудовані на базі найсучасніших алгоритмів машинного навчання.
Ця система надає можливість не лише озвучувати текст, а й детально налаштовувати голос, змінюючи інтонацію, тембр, емоційне забарвлення та стиль подачі. Наприклад, штучний інтелект може “говорити” голосом пірата або оповідача казок. Більш того, користувачі можуть задати власні інструкції для ще точнішого налаштування своїх аудіорозповідей.
Крім того, OpenAI покращила технологію розпізнавання мовлення. Нові моделі gpt-4o-transcribe та gpt-4o-mini-transcribe демонструють високий рівень точності перетворення мовлення в текст, навіть в умовах, які здаються складними, таких як сильний акцент, фоновий шум або різна швидкість мовлення.
Головна мета цієї розробки — зробити взаємодію зі штучним інтелектом максимально природною та подібною до живого спілкування. Оновлені голосові моделі без проблем інтегруються в різні додатки та сервіси.
Зараз нові можливості вже доступні для розробників через API, а всі бажаючі можуть випробувати їх на спеціальній демонстраційній платформі.
Підпишись на нас в Google НОВИНИ, та отримуй більше свіжих новин!
Monobank заблокував рахунки відомого блогера через скандал, викликавши обговорення в мережі. Дізнайтеся подробиці ситуації.
26 березня очікується сильна магнітна буря з К-індексом 6. Метеозалежним людям варто бути обережними, щоб…
Київстар повідомив про відключення 3G, що вплине на користувачів. Дізнайтеся, які зміни чекають українців у…
2025 рік прогнозують як один із найспекотніших років в історії, після 2023 та 2024. Нагальна…
Galaxy S26 Ultra обіцяє бути оптимізованим пристроєм, перевершивши S25 Ultra в продуктивності, камері та дизайні.
Досліджте цікаві українські прізвища, що свідчать про історію бідності їх носіїв. Перевірте своє ім'я у…