Група дослідників з Університету Гронінгена в Нідерландах стверджує, що вони розробили систему штучного інтелекту, яка може визначити, говорите ви прямолінійно і серйозно чи використовуєте лукаві жартівливі дотепи.
Їхня робота була представлена на зустрічі Акустичного товариства Америки в Оттаві, і вона поєднує аналіз тексту та голосу. Команду очолює аспірантка Сіюань Гао, яка «вирішує проблему образної мови» в рамках свого академічного дослідження.
Нейронну мережу вони навчали на мультимодальних даних — аудіокліпах, транскрибованому тексті та анотованому емоційному вмісті — зі сцен із насиченими сарказмом ситкомах, як-от «Друзі» та «Теорія великого вибуху», отриманих із бази даних MUSTARD.
Далі вони розробили алгоритм для відображення емоційних сигналів із аудіо та тексту та призначили відповідні смайли на основі аналізу настроїв. Це зробило штучний інтелект більш потужним у виявленні сарказму на основі багатогранного підходу, перевершивши інші інструменти, які покладаються лише на зміни висоти тексту та голосу.
«Наша методологія використовує сильні сторони кожної модальності: алгоритми розпізнавання емоцій аналізують аудіодані на афективні сигнали, тоді як аналіз настроїв обробляє текст, — пояснюється в дослідницькій статті. — Інтеграція цих модальностей має на меті компенсувати обмеження у сприйнятті висоти».
ШІ виявив сарказм у нових сценах ситкому з точністю близько 75%. Однак дослідники визнають, що люди все ще випереджають машини в цьому конкретному тесті сприйняття.
Цей інструмент виявлення сарказму є спробою знайти приховані почуття чи значення в людській мові, і він стає все більш важливим, оскільки вибухове впровадження чат-ботів ШІ означає мільйони щоденних розмов із великими мовними моделями (LLM).
Наприклад, компанія Hume AI каже, що розробила систему штучного інтелекту для виявлення різних інтонацій у голосі, щоб визначити діапазон емоцій, а не лише зміну тону чи настрою.
Hume розроблено для розуміння людських емоцій і реагування на них у більш детальний і чуйний спосіб, роблячи взаємодію ШІ більш природною та привабливою, пояснює компанія.
Тим часом команда з Університету прикладних наук Хаага-Хелія та Університету Оулу у Фінляндії минулого місяця опублікувала дослідницьку статтю, в якій досліджувала безконтактні методи мультимодального розпізнавання емоцій.
Інші дослідники намагалися проаналізувати використання емодзі, щоб правильно визначити емоційний стан людей, які їх використовують. Зрештою, текстове повідомлення, за яким слідує емодзі підморгування, може мати зовсім інше значення, ніж повідомлення без ілюстрації або з іншими емодзі.
Підпишись на нас в Google НОВИНИ, та отримуй більше свіжих новин!
Як вибрати смартфон у 2025 році: головні критерії, на які варто звернути увагу — батарея,…
Як працює мобільний та фіксований зв’язок Київстар під час блекаутів. Чому інколи зникає сигнал, як…
З 1 грудня у тарифах LOVE UA з’являються нові країни для міжнародних дзвінків: Франція, Данія…
Як обрати бюджетний смартфон, який працює як флагман? Розповідаємо, на які функції звернути увагу у…
Як зробити так, щоб смартфон працював довше без підзарядки? ТОП-15 порад, основаних на сучасних технологіях…
Які смартфони у 2025 році стали найкращими за співвідношенням ціни, якості та технологій? Огляд топ-5…