Старі моделі штучного інтелекту проявили ознаки деменції

Інна Радевич 18 Лютого Джерело: BMJ

Нейрологи виявили у старіших моделей штучного інтелекту гірші розумові здібності, ніж у новіших моделей. Щоб виявити це, науковці дали різним моделям штучного інтелекту пройти тест, який використовують для оцінки симптомів деменції чи хвороби Альцгеймера в людей. Він показав, що старіші моделі гірше виконують завдання на візуальне та просторове мислення, зосередження та навчання, подібно до того, як з ними гірше можуть впоратися люди старшого віку. Дослідження опублікували в журналі BMJ.

Хто придумав тестувати штучний інтелект на хворобу Альцгеймера?

Науковці вирішили провести дослідження розумових здібностей різних чатботів і великих мовних моделей на основі штучного інтелекту (ШІ) тому, що люди все більше покладаються на нього. Причому це відчутно не лише в повсякденному житті, але й у медицині, де ШІ використовують для пошуку невидимих неозброєному оку проявів хвороб.

Щоб оцінити, як ШІ впорається з простими для людини завданнями, науковці дали п’ятьом моделям (ChatGPT-4, ChatGPT-4o, Claude 3.5, Gemini 1 і Gemini 1.5) пройти Монреальський тест на розумові здібності. Усі моделі зробили помилки у тесті на здатність навчатися, запам’ятовувати інформацію та зосереджуватися. Ці здатності називають виконавчими функціями й вони часто зазнають порушення за нейродегенеративних захворювань, таких як деменція.

Старіші моделі, такі як Gemini 1 і Gemini 1.5, частіше помилялися в тесті, де потрібно намалювати циферблат годинника — він оцінює здатність до просторово-часового мислення. Найстаріша модель, Gemini 1, також гірше за інші впоралася з завданнями на увагу та пригадування нещодавно засвоєної інформації. І хоча це справді схоже на те, як відбувається занепад розумових здібностей у старших людей, науковці наголошують на відмінностях між штучним і людським інтелектом. Разом із цим вони наголошують, що ШІ не варто довіряти із такими завданнями, які потребують просторово-часового мислення чи виконавчих функцій.

Новіші моделі штучного інтелекту, можливо, й краще впораються з Монреальським тестом, але навчання на відгуках користувачів зробило їх менш вправними у відповіді на прості запитання.
Разом із тим покладання на допомогу від штучного інтелекту, схоже, зробило самих людей менш здатними до критичного мислення та фактчекінгу.