Нова версія штучного інтелекту DALL-E, створеного американською компанією OpenAI, дала можливість відредагувати власні зображення, створені за тектовим описом. Користувач зможе як попросити нейромережу підправити частину зображення, так і самостійно замінити якийсь елемент у готовому творі. А при завантаженні двох картинок DALL-E 2 може згенерувати третю, яка поєднуватиме елементи вихідних зображень.
Першу версію, DALL-E, OpenAI почала тестувати у січні минулого року. За словами розробників, вона працює на основі нейромережі CLIP, яку також представили минулого року. Вона вміє перетворювати текст або зображення у векторну версію цих даних, завдяки чому DALL-E 2 вміє пов'язувати між собою текстове та візуальне уявлення про найрізноманітніші об'єкти та поняття. Нова DALL-E 2 створює до чотирьох разів якісніші зображення, ніж попередня, спираючись лише на опис англійською мовою. Її назва, до речі, є складанням імені художника Сальвадора Далі та робота з мультику «ВОЛЛ·І» (англ. WALL·E) від Pixar.
«Лисиця, яка сидить у полі на сході сонця в стилі малюнків художника Клода Моне. Робота першої версії нейромережі порівняно з другою». OpenAI
Поки користуватися інструментом можливо, якщо зареєструватися у лист очікування на сайті. Але деякі вже отримали доступ та поділилися, як добре можуть словесно пояснити нейромережі свої творчі побажання. А поки ми у nauka.ua самі чекаємо на дозвіл спробувати, ми зібрали деякі приклади творчості користувачів Twitter.
Галерея робіт DALL-E 2 та їх текстових описів
«Людина та ШІ закохуються і створюють майбутніх дітей галактики Чумацький Шлях». Джерело тут та далі: BecomingCritter / Twitter
«Фото справжньої вітрини квіткового магазину з пастельно-зеленим та чистим білим фасадом, відкритими дверима та великим вікном»