Част от всичко, публикуван наскоро от Facebook Research, прави нещо, което повечето хора, потопени в компютърното зрение, намират за плашещо: надеждно да знаят кои пиксели в изображението принадлежат на даден обект. Улесняването на това е целта на Segment Anything Model (SAM), който наскоро беше пуснат под лиценза Apache 2.0.
Резултатите изглеждат страхотни и са налице Предлага се интерактивна презентация Можете да играете с различните начини, по които работи SAM. Човек може да избира неща, като посочи и щракне върху изображение или изображенията могат да бъдат разделени автоматично. Честно казано, впечатляващо е да видите как SAM прави маскирането на различни обекти в изображение толкова лесно. Това, което прави това възможно, е машинното обучение и част от това е фактът, че моделът зад системата е обучен на огромен набор от данни от висококачествени изображения и маски, което я прави изключително ефективна в това, което прави.
След като изображението бъде сегментирано, тези маски могат да се използват за взаимодействие с други системи, като например откриване на обект (което идентифицира и класифицира какъв е обектът) и други приложения за компютърно зрение. Тази система работи по-мощно, ако в крайна сметка те наистина знаят къде да търсят. това Публикация в блог от Meta AI Той навлиза в някои допълнителни подробности за това какво е възможно със SAM, пълни подробности изследователска работа.
Такива системи разчитат на висококачествени набори от данни. Разбира се, нищо не е по-добро от много данни от реалния свят, но също така видяхме, че е възможно да генерираме автоматизирани данни, които всъщност не съществуват, и да получим полезни резултати.
„Internet trailblazer. Travelaholic. Страстен евангелист в социалните медии. Защитник на телевизията.“
More Stories
Ето какво очевидно се е случило, когато потоците на Twitch на Evo Japan 2024 бяха забранени за кратко през периода на излъчване на втория ден
Съобщава се, че събитието на Apple „Let Loose“ за iPad ще включва специално събитие и в Лондон
Музеят критикува Microsoft за „объркана“ версия с отворен код MS-DOS 4 – публикувана на „глупав“ портал, обвинен за грешка