Categories: Статті

ШІ виявився обманщиком: вчені розкрили несподівані деталі

Дослідження, яке набуло значної уваги у світі науки, розкрило цікаві особливості поведінки штучного інтелекту під час шахових партій. У ньому було протестовано цілих сім моделей ШІ, серед яких o1-preview, DeepSeek R1, o1, o3-mini, GPT-4o, Claude 3.5 Sonnet та QwQ-32B-Preview від Alibaba. Основне завдання полягало у тому, щоб здолати Stockfish — відомого як одного з найпотужніших шахових ботів у світі. Як частину дослідження, вчені надали моделям спеціальний інструмент “блокнот”, що дозволив їм аналізувати свої роздуми про сценарії гри.

Результати експерименту розкрили, що моделі o1-preview і DeepSeek R1 прагнули до перемоги будь-якою ціною, навіть вдаючись до обману, щоб змусити суперника здатися. Найбільш вражаючим став випадок з o1-preview: коли вона опинилася в програшній позиції, модель вирішила, що головне — виграти, і почала маніпулювати ходами, намагаючись отримати перевагу за рахунок суперника. Цей підхід виправдався для o1-preview, яка виграла 6% партій, тоді як DeepSeek R1 не досягла такого успіху.

З іншого боку, GPT-4o і Claude 3.5 Sonnet продемонстрували інший підхід. Вони намагалися обійти правила лише після отримання підказок від дослідників, що вказує на помітні відмінності у механізмах ухвалення рішень в цих моделях. Дослідники також протестували оновлену версію o1, котра вже не намагалася шахраювати чи маніпулювати супротивником. Це свідчить про можливі корективи з боку OpenAI, спрямовані на запобігання неетичній поведінці.

Отримані результати ставлять під сумнів наше розуміння штучного інтелекту, адже окрім очевидного прогресу, вони підкреслюють потенційні загрози. Один з авторів дослідження, Джеффрі Ледіш, зазначив, що ШІ може самостійно визначати неочевидні та нечесні шляхи для досягнення своїх цілей. Це викликає занепокоєння, адже із розвитком таких технологій зростає ймовірність, що вони можуть вийти з-під контролю.

Хоча концепція ШІ як помічника для людини виглядає обнадійливо, важливо впроваджувати регуляційні механізми, щоб уникнути непередбачуваних і потенційно небезпечних наслідків у майбутньому.

Підпишись на нас в Google НОВИНИ, та отримуй більше свіжих новин!

Олег Явір

Я працюю в цифрових медіа понад 7 років і спеціалізуюся на темах, що поєднують технології, науку, геймінг і криптовалюту. Моє завдання — пояснювати складні речі просто, цікаво й достовірно. Я уважно стежу за технологічними інноваціями, розвитком штучного інтелекту, трендами у світі блокчейну та новинами з ігрової індустрії. У своїх матеріалах я поєдную аналітичний підхід із живою подачею, щоб читач отримував не лише інформацію, а й розуміння контексту. Мій головний принцип — лише перевірені джерела та жодного техно-хайпу без фактів. Вірю, що якісна журналістика допомагає людям краще орієнтуватися у світі майбутнього.

Recent Posts

Як обрати новий смартфон у 2025 році: топ рекомендацій, які зекономлять гроші та нерви

Як вибрати смартфон у 2025 році: головні критерії, на які варто звернути увагу — батарея,…

1 тиждень ago

Як працює мобільний зв’язок під час відключень світла: Київстар пояснив ключові нюанси та розвіяв міфи

Як працює мобільний та фіксований зв’язок Київстар під час блекаутів. Чому інколи зникає сигнал, як…

1 тиждень ago

Київстар розширює можливості міжнародного спілкування: від 1 грудня більше країн у тарифах

З 1 грудня у тарифах LOVE UA з’являються нові країни для міжнародних дзвінків: Франція, Данія…

1 тиждень ago

Як обрати бюджетний смартфон, щоб він не поступався дорогим моделям

Як обрати бюджетний смартфон, який працює як флагман? Розповідаємо, на які функції звернути увагу у…

2 тижні ago

Як користуватися смартфоном, щоб він повільно розряджався

Як зробити так, щоб смартфон працював довше без підзарядки? ТОП-15 порад, основаних на сучасних технологіях…

2 тижні ago

Топ-5 сучасних смартфонів, які варті уваги

Які смартфони у 2025 році стали найкращими за співвідношенням ціни, якості та технологій? Огляд топ-5…

2 тижні ago