2024-02-08
161
1 min.


Apple stellt Modell der künstlichen Intelligenz für die Fotobearbeitung mit Textvorschlägen vor

Apple-Forscher haben eine neue Version der künstlichen Intelligenz entwickelt, die es Benutzern ermöglicht, die Änderungen, die sie an Fotos vornehmen möchten, in einfachen Worten zu beschreiben. Auch ohne Fotobearbeitungssoftware ist das Bearbeiten von Bildern jetzt möglich.

Künstliche Intelligenz von Apple

Fotos mithilfe von Textaufforderungen ändern

Ein neues Modell für künstliche Intelligenz, das von Apple in Zusammenarbeit mit dem entwickelt wurde California University in Santa Barbara, genannt MGIE (MLLM-Guided Image Editing). Es ermöglicht Benutzern, detaillierte Änderungen wie Zuschneiden, Größenänderung, Spiegeln und Anwenden von Filtern auf Fotos mithilfe von Texteingabeaufforderungen vorzunehmen. MGIE ist auch für komplexere Bearbeitungsaufgaben geeignet, beispielsweise das Ändern der Form oder Helligkeit bestimmter Objekte in einem Foto.

Hauptmerkmale des MGIE-Modells

MGIE kombiniert zwei verschiedene Arten multimodaler Sprachmodelle. Zunächst lernt es, die Anweisungen des Benutzers zu interpretieren. Anschließend stellt sie sich eine imaginäre Bearbeitung vor (wenn Sie beispielsweise in einem Foto nach einem blaueren Himmel fragen, würde dies den Himmelsteil des Bildes aufhellen).

Apple stellt Modell der künstlichen Intelligenz für die Fotobearbeitung mit Textvorschlägen vor

Einfache Fotobearbeitung für Benutzer

Mit MGIE können Benutzer einfach eine Beschreibung von eingeben was sie auf dem Foto ändern wollen. Wenn Sie beispielsweise ein Foto einer Peperoni-Pizza bearbeiten, können Sie die Aufforderung „Gesünder machen“ verwenden und das Modell fügt Gemüsebelag hinzu. Wenn ein Foto eines Tigers in der Sahara zu dunkel aussieht, wird das Bild durch die Anweisung „mehr Kontrast hinzufügen, um mehr Licht zu erzeugen“ heller.

„Anstelle mehrdeutiger Hinweise erkennt MGIE die eindeutige visuelle Absicht der Benutzer und erstellt Bildbearbeitungen, die diesen Absichten entsprechen“, schreiben die Forscher in der Arbeit.

Apple stellt MGIE zum Download über GitHub zur Verfügung und hat außerdem eine Webdemo von Hugging Face Spaces veröffentlicht. Das Unternehmen hat seine Zukunftspläne für dieses Modell noch nicht bekannt gegeben.

Glossar

  • Apple ist ein Unternehmen, das Elektronik und Software herstellt.
  • MGIE (MLLM-Guided Image Editing) ist ein von Apple und der University of California, Santa Barbara, entwickeltes Modell der künstlichen Intelligenz zum Bearbeiten von Fotos mithilfe von Textvorschlägen.
  • GitHub ist eine Plattform für Softwareentwicklung und Repository-Hosting.

Links

  • The Verge – Informationsquelle über Apple-Innovationen .

Antworten auf Fragen

Was ist die neue Version der künstlichen Intelligenz, die von Apple-Forschern entwickelt wurde? ?

Eine neue Version der künstlichen Intelligenz, die von Apple-Forschern entwickelt wurde, ermöglicht es Benutzern, Änderungen an einem Foto in einfachen Worten zu beschreiben und diese Änderungen vorzunehmen, ohne eine Fotobearbeitungssoftware zu verwenden.

Wie heißt das neue Modell der künstlichen Intelligenz, das von Apple entwickelt wurde?

Das neue von Apple entwickelte Modell der künstlichen Intelligenz heißt MGIE (MLLM-Guided Image Editing).

Welche Änderungen können Benutzer mithilfe von Textvorschlägen an Fotos vornehmen?

Mithilfe von Textaufforderungen können Benutzer verschiedene Änderungen an Fotos vornehmen, z. B. Zuschneiden, Größenänderung, Spiegeln und Anwenden von Filtern. Sie können auch komplexere Aufgaben ausführen, beispielsweise die Form oder Helligkeit bestimmter Objekte in einem Foto ändern.

Welche Funktionen hat das MGIE-Modell?

Das MGIE-Modell kombiniert zwei verschiedene Arten multimodaler Sprachmodelle. Es lernt, die Anweisungen des Benutzers zu interpretieren und stellt sich auf der Grundlage dieser Anweisungen eine imaginäre Bearbeitung vor.

Wie können Benutzer Fotos mit MGIE bearbeiten?

Benutzer können die Änderungen, die sie an Fotos vornehmen möchten, einfach mithilfe von Tooltips beschreiben. Beispielsweise werden Sie möglicherweise gebeten, das Foto aufzuhellen oder bestimmte Objekte hinzuzufügen. MGIE erkennt diese Absichten und nimmt entsprechende Änderungen am Bild vor.

Copywriter Elbuz
Kurzbeschreibung
Apple-Forscher haben ein Modell der künstlichen Intelligenz entwickelt, das es Benutzern ermöglicht, Änderungen in Fotos mithilfe von Textaufforderungen zu beschreiben, ohne dass eine spezielle Software erforderlich ist.
Artikelziel
Informieren und beschreiben Sie Apples neue Entwicklung in der Fotobearbeitung mithilfe künstlicher Intelligenz
Stil
Informationsstil
Zielpublikum
Fotografen, Fotobearbeitungsbegeisterte, Technikbegeisterte


Inhaltsverzeichnis:



Den Link zu diesem Artikel speichern

Diskussion über das Thema – Apple stellt Modell der künstlichen Intelligenz für die Fotobearbeitung mit Textvorschlägen vor


Apple-Forscher haben ein Modell der künstlichen Intelligenz entwickelt, das es Benutzern ermöglicht, Änderungen in Fotos mithilfe von Textaufforderungen zu beschreiben, ohne dass eine spezielle Software erforderlich ist.


Für dieses Produkt gibt es noch keine Bewertungen


Captcha


Nachster