Част от всичко, публикуван наскоро от Facebook Research, прави нещо, което повечето хора, потопени в компютърното зрение, намират за плашещо: надеждно да знаят кои пиксели в изображението принадлежат на даден обект. Улесняването на това е целта на Segment Anything Model (SAM), който наскоро беше пуснат под лиценза Apache 2.0.
Резултатите изглеждат страхотни и са налице Предлага се интерактивна презентация Можете да играете с различните начини, по които работи SAM. Човек може да избира неща, като посочи и щракне върху изображение или изображенията могат да бъдат разделени автоматично. Честно казано, впечатляващо е да видите как SAM прави маскирането на различни обекти в изображение толкова лесно. Това, което прави това възможно, е машинното обучение и част от това е фактът, че моделът зад системата е обучен на огромен набор от данни от висококачествени изображения и маски, което я прави изключително ефективна в това, което прави.
След като изображението бъде сегментирано, тези маски могат да се използват за взаимодействие с други системи, като например откриване на обект (което идентифицира и класифицира какъв е обектът) и други приложения за компютърно зрение. Тази система работи по-мощно, ако в крайна сметка те наистина знаят къде да търсят. това Публикация в блог от Meta AI Той навлиза в някои допълнителни подробности за това какво е възможно със SAM, пълни подробности изследователска работа.
Такива системи разчитат на висококачествени набори от данни. Разбира се, нищо не е по-добро от много данни от реалния свят, но също така видяхме, че е възможно да генерираме автоматизирани данни, които всъщност не съществуват, и да получим полезни резултати.

„Internet trailblazer. Travelaholic. Страстен евангелист в социалните медии. Защитник на телевизията.“

More Stories
Anthropic предлага временно забавяне на развитието на изкуствения интелект
Google Gemini 3.5 Flash показва ново поколение изкуствен интелект
Изкуственият интелект спори сам със себе си за бъдещето на професиите