Алгоритм машинного навчання знайшов потенційні ліки проти туберкульозу
Американські вчені покращили здатність алгоритмів машинного навчання робити передбачення в біології, завдяки враховуванню невизначеності даних, які вони аналізують. Цей підхід дав змогу знайти в базі даних хімічних сполук речовини, які в дослідах показали високу ефективність проти туберкульозної палички. Розробники сподіваються, що їхній винахід сприятиме пошуку та розробленню нових ефективних медикаментів. Дослідження опубліковане у журналі Cell Systems.
Застосування машинного навчання в біології?
Машинним навчанням називають тип комп’ютерного моделювання, в якому певний алгоритм робить передбачення на основі тих даних, що йому вже відомі. Дедалі частіше цей метод стали використовувати в дослідженнях біологи, коли потрібно обробити великі масиви даних. Наприклад, щоб знайти в базах даних речовин потенційні ліки із необхідними властивостями для лікування конкретних захворювань. Але таке застосування методу має обмеження - ці моделі справді чудово впораються з аналізом інформації, яка схожа на ту, на якій алгоритм навчався, але вони не надто добре аналізують молекули, які суттєво відрізняються від тих, що відомі алгоритму. Вчені з Массачусетського технологічного університету попрацювали над тим, щоб усунути це обмеження.
Як змінили машинне навчання вчені?
Дослідники використали технологію з назвою Гауссівський процес, щоб присвоїти значення невизначеності даним, на основі яких алгоритми навчаються. Коли модель аналізує дані навчання, вона враховує, наскільки надійними є прогнози. Приміром, якщо дані, що використовуються під час навчання, містять передбачення, наскільки сильно якась молекула зв’язується з цільовим білком, та невизначеність цих прогнозів, то модель зможе використати цю інформацію, щоб прогнозувати взаємодії білок-ціль, з якими вона раніше не стикалася. Зокрема, модель аналізує вірогідність власних прогнозів, а для навчання алгоритму потрібна невелика кількість інформації. Такий принцип роботи машинного навчання не є новаторським, але його вперше пропонують використовувати для досліджень в біології.
Що дала ця зміна?
Вчені випробували свою технологію, коли натренували модель на базі даних з інформацією всього про 72 невеликі молекули та їхні взаємодії з понад 400 білками, що звуться кіназами. Після цього їхній алгоритм зміг проаналізувати 11 тисяч малих молекул із загальнодоступної бази даних хімічних сполук ZINC. Частина з цих речовин сильно відрізнялася від тих, на яких вчився алгоритм.
Під час випробувань алгоритм знайшов речовини, які можуть з’єднуватися із кіназою PknB туберкульозної палички Mycobacterium tuberculosis. Цей білок є критично важливим для виживання бактерії, але жодні сучасні антибіотики не націлені на нього. Подальші експерименти показали, що запропоновані моделлю речовини мали передбачені властивості в 90 відсотках випадків. Для порівняння, попередні моделі машинного навчання прогнозують з точність приблизно 30-40 відсотків. Найбільш обнадійливі сполуки протестували в дослідах, і виявилося, що вони успішно пригнічують ріст туберкульозної палички у поживних середовищах та інфікованих бактерією людських імунних клітинах.
Вчені сподіваються, що їхній винахід допоможе створити нові ефективні ліки проти туберкульозу та інших захворювань.