2024-02-08
162
2 хв.


Apple представляє модель штучного інтелекту для редагування фотографій за допомогою текстових підказок

Дослідники Apple розробили нову версію штучного інтелекту, яка дозволяє користувачам простими словами описувати зміни, які вони хочуть зробити на фотографії. Навіть без використання програмного забезпечення для редагування фотографій тепер можна змінити зображення.

Apple Штучний Інтелект

Зміна фотографій за допомогою текстових підказок

Нова модель штучного інтелекту, розроблена Apple у співпраці з Каліфорнійським університетом у Санта-Барбарі, називається MGIE (MLLM-Guided Image Editing). Вона дозволяє користувачам докладно описувати зміни, такі як обрізання, зміна розміру, переворот та застосування фільтрів до фотографій за допомогою текстових підказок. MGIE також може виконувати більш складні завдання редагування, такі як зміна форми або яскравості певних об'єктів на фотографії.

Ключові особливості моделі MGIE

MGIE комбінує два різних типи мультимодальних мовних моделей. По-перше, вона вчиться інтерпретувати вказівки користувача. Потім вона представляє уявне редагування (наприклад, запит на синє небо на фотографії призведе до яскравості частини зображення з небом).

Apple представляє модель штучного інтелекту для редагування фотографій за допомогою текстових підказок

Просте редагування фотографій для користувачів

З використанням MGIE користувачі можуть просто вводити опис того, що вони хочуть змінити фотографії. Наприклад, при редагуванні фотографії піци пепероні можна використовувати підказку "зроби здоровішою", і модель додасть овочеву начинку. Якщо фотографія тигра в Сахарі виглядає занадто темною, то після вказівки "додати більше контрасту, щоб створити більше світла", зображення стане яскравішим.

"Замість двозначних вказівок, MGIE розпізнає однозначні візуальні наміри користувачів та створює редагування зображень, що відповідає цим намірам", - йдеться у статті дослідників.

Apple надає можливість скачування MGIE через GitHub і також випустила веб-демонстрацію Hugging Face Spaces. Компанія поки не повідомила про свої подальші плани щодо цієї моделі.

Глосарій

  • Apple - компанія, виробник електроніки та програмного забезпечення.
  • MGIE (MLLM-Guided Image Editing) - модель штучного інтелекту, розроблена Apple та Каліфорнійським університетом у Санта-Барбарі, для редагування фотографій за допомогою текстових підказок.
  • GitHub - платформа для розробки програмного забезпечення та хостингу репозиторіїв.

Посилання

  • The Verge - джерело інформації про інновацію від Apple .

Відповіді на питання

Що являє собою нова версія штучного інтелекту, розробленого дослідниками Apple?

Нова версія штучного інтелекту, розроблена дослідниками Apple, дозволяє користувачам описувати зміни на фотографії простими словами та вносити ці зміни без використання програмного забезпечення для редагування фотографій.

Як називається нова модель штучного інтелекту, розроблена Apple?

Нова модель штучного інтелекту, розроблена Apple, називається MGIE (MLLM-Guided Image Editing).

Які зміни можуть вносити користувачі на фотографіях за допомогою текстових підказок?

За допомогою текстових підказок користувачі можуть вносити різні зміни на фотографіях, такі як обрізка, зміна розміру, переворот та застосування фільтрів. Вони також можуть виконувати більш складні завдання, такі як зміна форми або яскравість певних об'єктів на фотографії.

Які особливості має модель MGIE?

Модель MGIE комбінує два різні типи мультимодальних мовних моделей. Вона навчається інтерпретувати вказівки користувача та представляє уявне редагування на основі цих вказівок.

Як користувачі можуть редагувати фотографії з використанням MGIE?

Користувачі можуть просто описувати зміни, які вони хочуть внести на фотографії за допомогою підказок. Наприклад, вони можуть просити зробити фотографію яскравішою або додати певні об'єкти. MGIE розпізнає ці наміри та вносить відповідні зміни на зображенні.

Копірайтер Elbuz
Короткий опис
Дослідники Apple розробили модель штучного інтелекту, яка дозволяє користувачам описувати зміни на фотографіях за допомогою текстових підказок без використання спеціального програмного забезпечення.
Мета статті
Інформувати та описати нову розробку Apple у сфері редагування фотографій за допомогою штучного інтелекту
Стиль
Інформаційний стиль
Цільова аудиторія
Фотографи, любителі редагування фотографій, техно-ентузіасти


Зміст:



Збережи посилання на цю сторінку

Обговорення теми – Apple представляє модель штучного інтелекту для редагування фотографій за допомогою текстових підказок


Дослідники Apple розробили модель штучного інтелекту, яка дозволяє користувачам описувати зміни на фотографіях за допомогою текстових підказок без використання спеціального програмного забезпечення.


Немає відгуків.


Захист від роботів


Далі