Старі моделі штучного інтелекту проявили ознаки деменції
Нейрологи виявили у старіших моделей штучного інтелекту гірші розумові здібності, ніж у новіших моделей. Щоб виявити це, науковці дали різним моделям штучного інтелекту пройти тест, який використовують для оцінки симптомів деменції чи хвороби Альцгеймера в людей. Він показав, що старіші моделі гірше виконують завдання на візуальне та просторове мислення, зосередження та навчання, подібно до того, як з ними гірше можуть впоратися люди старшого віку. Дослідження опублікували в журналі BMJ.

Одним із завдань у тесті на погіршення розумових здібностей є намалювати годинник. Усі моделі штучного інтелекту не змогли намалювати правильно годинник (C-H), який показував би 11:10. Dayan et al. / BMJ, 2024
Хто придумав тестувати штучний інтелект на хворобу Альцгеймера?
Науковці вирішили провести дослідження розумових здібностей різних чатботів і великих мовних моделей на основі штучного інтелекту (ШІ) тому, що люди все більше покладаються на нього. Причому це відчутно не лише в повсякденному житті, але й у медицині, де ШІ використовують для пошуку невидимих неозброєному оку проявів хвороб.
Щоб оцінити, як ШІ впорається з простими для людини завданнями, науковці дали п’ятьом моделям (ChatGPT-4, ChatGPT-4o, Claude 3.5, Gemini 1 і Gemini 1.5) пройти Монреальський тест на розумові здібності. Усі моделі зробили помилки у тесті на здатність навчатися, запам’ятовувати інформацію та зосереджуватися. Ці здатності називають виконавчими функціями й вони часто зазнають порушення за нейродегенеративних захворювань, таких як деменція.
Старіші моделі, такі як Gemini 1 і Gemini 1.5, частіше помилялися в тесті, де потрібно намалювати циферблат годинника — він оцінює здатність до просторово-часового мислення. Найстаріша модель, Gemini 1, також гірше за інші впоралася з завданнями на увагу та пригадування нещодавно засвоєної інформації. І хоча це справді схоже на те, як відбувається занепад розумових здібностей у старших людей, науковці наголошують на відмінностях між штучним і людським інтелектом. Разом із цим вони наголошують, що ШІ не варто довіряти із такими завданнями, які потребують просторово-часового мислення чи виконавчих функцій.
- Новіші моделі штучного інтелекту, можливо, й краще впораються з Монреальським тестом, але навчання на відгуках користувачів зробило їх менш вправними у відповіді на прості запитання.
- Разом із тим покладання на допомогу від штучного інтелекту, схоже, зробило самих людей менш здатними до критичного мислення та фактчекінгу.