Дослідники навчили штучний інтелект розпізнавати сарказм

Група дослідників з Університету Гронінгена в Нідерландах стверджує, що вони розробили систему штучного інтелекту, яка може визначити, говорите ви прямолінійно і серйозно чи використовуєте лукаві жартівливі дотепи.
Їхня робота була представлена на зустрічі Акустичного товариства Америки в Оттаві, і вона поєднує аналіз тексту та голосу. Команду очолює аспірантка Сіюань Гао, яка «вирішує проблему образної мови» в рамках свого академічного дослідження.
Нейронну мережу вони навчали на мультимодальних даних — аудіокліпах, транскрибованому тексті та анотованому емоційному вмісті — зі сцен із насиченими сарказмом ситкомах, як-от «Друзі» та «Теорія великого вибуху», отриманих із бази даних MUSTARD.
Далі вони розробили алгоритм для відображення емоційних сигналів із аудіо та тексту та призначили відповідні смайли на основі аналізу настроїв. Це зробило штучний інтелект більш потужним у виявленні сарказму на основі багатогранного підходу, перевершивши інші інструменти, які покладаються лише на зміни висоти тексту та голосу.
«Наша методологія використовує сильні сторони кожної модальності: алгоритми розпізнавання емоцій аналізують аудіодані на афективні сигнали, тоді як аналіз настроїв обробляє текст, — пояснюється в дослідницькій статті. — Інтеграція цих модальностей має на меті компенсувати обмеження у сприйнятті висоти».
ШІ виявив сарказм у нових сценах ситкому з точністю близько 75%. Однак дослідники визнають, що люди все ще випереджають машини в цьому конкретному тесті сприйняття.
Цей інструмент виявлення сарказму є спробою знайти приховані почуття чи значення в людській мові, і він стає все більш важливим, оскільки вибухове впровадження чат-ботів ШІ означає мільйони щоденних розмов із великими мовними моделями (LLM).
Наприклад, компанія Hume AI каже, що розробила систему штучного інтелекту для виявлення різних інтонацій у голосі, щоб визначити діапазон емоцій, а не лише зміну тону чи настрою.
Hume розроблено для розуміння людських емоцій і реагування на них у більш детальний і чуйний спосіб, роблячи взаємодію ШІ більш природною та привабливою, пояснює компанія.
Тим часом команда з Університету прикладних наук Хаага-Хелія та Університету Оулу у Фінляндії минулого місяця опублікувала дослідницьку статтю, в якій досліджувала безконтактні методи мультимодального розпізнавання емоцій.
Інші дослідники намагалися проаналізувати використання емодзі, щоб правильно визначити емоційний стан людей, які їх використовують. Зрештою, текстове повідомлення, за яким слідує емодзі підморгування, може мати зовсім інше значення, ніж повідомлення без ілюстрації або з іншими емодзі.
Підпишись на нас в Google НОВИНИ, та отримуй більше свіжих новин!