Компанія OpenAI, відома завдяки створенню ChatGPT, радісно повідомила про запуск нового покоління голосових моделей, які здатні перетворювати текст в мовлення і навпаки. У компанії акцентують увагу на тому, що ці моделі побудовані на базі найсучасніших алгоритмів машинного навчання.
Ця система надає можливість не лише озвучувати текст, а й детально налаштовувати голос, змінюючи інтонацію, тембр, емоційне забарвлення та стиль подачі. Наприклад, штучний інтелект може “говорити” голосом пірата або оповідача казок. Більш того, користувачі можуть задати власні інструкції для ще точнішого налаштування своїх аудіорозповідей.
Крім того, OpenAI покращила технологію розпізнавання мовлення. Нові моделі gpt-4o-transcribe та gpt-4o-mini-transcribe демонструють високий рівень точності перетворення мовлення в текст, навіть в умовах, які здаються складними, таких як сильний акцент, фоновий шум або різна швидкість мовлення.
Головна мета цієї розробки — зробити взаємодію зі штучним інтелектом максимально природною та подібною до живого спілкування. Оновлені голосові моделі без проблем інтегруються в різні додатки та сервіси.
Зараз нові можливості вже доступні для розробників через API, а всі бажаючі можуть випробувати їх на спеціальній демонстраційній платформі.
Підпишись на нас в Google НОВИНИ, та отримуй більше свіжих новин!
Як вибрати смартфон у 2025 році: головні критерії, на які варто звернути увагу — батарея,…
Як працює мобільний та фіксований зв’язок Київстар під час блекаутів. Чому інколи зникає сигнал, як…
З 1 грудня у тарифах LOVE UA з’являються нові країни для міжнародних дзвінків: Франція, Данія…
Як обрати бюджетний смартфон, який працює як флагман? Розповідаємо, на які функції звернути увагу у…
Як зробити так, щоб смартфон працював довше без підзарядки? ТОП-15 порад, основаних на сучасних технологіях…
Які смартфони у 2025 році стали найкращими за співвідношенням ціни, якості та технологій? Огляд топ-5…