Apple пуска модел с изкуствен интелект, който може да редактира снимки въз основа на текстови команди

Apple не е един от най-добрите играчи в AI играта днес, но новият AI модел с отворен код на компанията за редактиране на снимки показва какво може да допринесе в тази област. Моделът се нарича MLLM-направлявано редактиране на изображения (MGIE), което използва мултимодални големи езикови модели (MLLM) за интерпретиране на текстови команди при обработка на изображения. С други думи, инструментът има способността да редактира изображения въз основа на текста, който потребителят въвежда. Въпреки че това не е първият инструмент, който може да направи това, „човешките инструкции понякога са твърде кратки, за да могат съществуващите методи да бъдат уловени и следвани.“ Проектен лист (PDF) Прочетете.

Компанията разработи MGIE с изследователи от Калифорнийския университет в Санта Барбара. MLLM имат способността да превръщат прости или двусмислени текстови подкани в по-подробни и ясни инструкции, които самият редактор на изображения може да следва. Например, ако потребител иска да редактира изображение на пица с пеперони, за да го „направи по-здравословно“, MLLM могат да го интерпретират като „добавяне на веган гарнитура“ и да редактират изображението като такова.

Снимки на пица, гепарди, компютри и хора. — ябълка

В допълнение към извършването на значителни промени в изображенията, MGIE може също да изрязва, преоразмерява и завърта изображения, както и да подобрява тяхната яркост, контраст и цветови баланс, всичко чрез текстови подкани. Може също така да модифицира определени области от изображението и може например да модифицира косата, очите и облеклото на човека в него или да премахва обекти на заден план.

като venturebeat Бележки, Apple пусна модела чрез githubно желаещите могат да пробват и a експериментален Което в момента се хоства в Hugging Face Spaces. Apple все още не е изяснила дали планира да използва наученото от този проект в инструмент или функция, която може да интегрира в някой от своите продукти.

Nikolay Petkov

Николай Петков е автор в PRKernel.com, който следи и отразява актуални събития от сферата на новините, политиката, бизнеса, технологиите, спорта, развлеченията и начина на живот. Той се стреми да представя информацията по ясен, достъпен и обективен начин, като поставя акцент върху точността и значимостта за читателите. Работата му е насочена към предоставяне на полезни факти, актуални развития и истории, които помагат на аудиторията да бъде добре информирана за случващото се в страната и по света.

Apple пуска модел с изкуствен интелект, който може да редактира снимки въз основа на текстови команди

Google Maps най-накрая получава една от най-очакваните функции в Android Auto

Xiaomi официално потвърди 7-инчов OLED дисплей и голяма батерия за Redmi Note 17

Anthropic предлага временно забавяне на развитието на изкуствения интелект

Автомобилната индустрия тества ново биогориво, произведено от отпадъчни материали

България и Русия отново ще се срещнат във волейболна надпревара при девойките до 20 години

Google Maps най-накрая получава една от най-очакваните функции в Android Auto

Xiaomi официално потвърди 7-инчов OLED дисплей и голяма батерия за Redmi Note 17

Вашият коментар Отказ

Още истории

Google Maps най-накрая получава една от най-очакваните функции в Android Auto

Xiaomi официално потвърди 7-инчов OLED дисплей и голяма батерия за Redmi Note 17

Anthropic предлага временно забавяне на развитието на изкуствения интелект

Може да сте пропуснали

Автомобилната индустрия тества ново биогориво, произведено от отпадъчни материали

България и Русия отново ще се срещнат във волейболна надпревара при девойките до 20 години

Google Maps най-накрая получава една от най-очакваните функции в Android Auto

Xiaomi официално потвърди 7-инчов OLED дисплей и голяма батерия за Redmi Note 17