Штучний інтелект навчив собак виконувати команди

Марина Качура 15 Січня 2021 Джерело: arXiv.org

Розробники з університету Колорадо навчили алгоритм розпізнавати різні положення собак, а потім оснастили його камерою та динаміками, з якими він сам почав навчати собак. Прототип пристрою може віддавати найпростіші команди на кшталт «сидіти» та навіть заохочувати ласощами, якщо собака виконала команду. У майбутньому розробники планують навчити алгоритм розпізнавати настрій тварин, щоб не нашкодити улюбленцям під час тренування. Докладніша інформація про алгоритм доступна у препринті на сайті arXiv.org.

Як навчити собаку виконувати команди?

Під час дресування тварина отримує зазвичай голосовий сигнал, виконує дію і отримує реакцію тренера на неї. Так у тварини формується набутий рефлекс. Одним зі способів тренування собак є позитивне підкріплення — бажана поведінка закріплюється за допомогою бажаного стимулу або зникнення неприємного стимулу(у тренуваннях через покарання навпаки — бажаний стимул зникає, а неприємний посилюється). Однак, дослідження показують, що поведінка собак під час найперших тренувань може навіть погіршуватися, якщо їхні дії залишатимуться без винагороди, наприклад, ласощів або просто приємних слів. І Nauka.ua також писала, що дресування через покарання нашкодило психічному здоров’ю собак. Тож розроблений вченими алгоритм спирається саме на позитивне підкріплення.

Як навчити ШІ тренувати собак?

У своїй роботі вчені використали традиційний метод машинного навчання для класифікації зображень. Так спочатку алгоритм навчили визначати три стандартні завдання для собачих компаньйонів: «сидіти», «стояти» і «лежати», з 2 тисячами яких він справився з точністю до 92 відсотків. Ці команди ШІ віддаватиме за допомогою динаміка, визначатиме їхнє виконання у режимі реального часу за допомогою камери, а у разі успішно виконаного завдання, сигнал передаватиметься на серводвигун, який вивільнюватиме ласощі, як винагороду. Якщо ж навпаки, то програма нічого не робитиме.

Однак, вчені наголошують, що незалежно від того, наскільки ефективно працює алгоритм, вони обмежені частотою кадрів камери — 30 в секунду. І хоч додаток працює без збоїв з частотою кадрів близько 10 кадрів в секунду, будь-яка частота кадрів вище цієї буде неефективною, якщо використовувати ласощі як нагороду. Тоді програма заохочуватиме успішну поведінку на основі кожного кадру або поведінку, яку собака демонструє за частку секунди або між діями.

Як алгоритм тренуватиме собак?

Рішення алгоритм приймає, ґрунтуючись на кількості своїх висновків про успішно виконану команду в черзі, тобто середній результат. Таким чином, говорять розробники, програма дасть змогу нагороджувати собаку, якщо вона демонструє потрібну поведінку протягом заданого проміжку часу. І хоч поки програмі важко відрізнити собаку, яка стоїть від тої, що лежить, піддослідна австралійська вівчарка одного із авторів статті виявила інтерес до прототипу і навіть отримала винагороду. Однак, розробники стурбовані емоційним станом собак під час тренувань, тому у майбутньому планують розширити розпізнавані алгоритмом дії тварин та навчити його визначати їхній настрій за, наприклад, рухом хвоста або вух.