(資料圖)
周三,F(xiàn)acebook的母公司Meta(META.US)發(fā)布了一款人工智能(AI)模型,能夠從圖像中識別單個物體,該公司同時發(fā)布了一個據(jù)稱是同類產(chǎn)品中最大的圖像注釋數(shù)據(jù)集。
在一篇博文中,Meta研究部門介紹了該公司的“Segment Anything Model”(簡稱SAM)。SAM可以識別圖像和視頻中的物體,即使在訓(xùn)練過程中沒有遇到這些物體。通過使用SAM,用戶可以通過點擊物體或書寫文字提示來選擇物體。在一次演示中,當(dāng)輸入“貓”這個詞后,該工具在一張照片中的幾只貓周圍繪制了方框。
Meta已經(jīng)展示了一些功能,利用生成性AI類型,與ChatGPT一樣,可以創(chuàng)造全新的內(nèi)容,而不是像其他AI那樣僅僅識別或分類數(shù)據(jù),盡管尚未發(fā)布具體產(chǎn)品。其中一個示例包括從文本提示中生成超現(xiàn)實主義視頻的工具,以及從散文中生成兒童書籍插圖的工具。CEO扎克伯格表示,將這種生成性AI作為“創(chuàng)意輔助工具”納入Meta的應(yīng)用程序是今年的優(yōu)先事項。
事實上,Meta已經(jīng)在內(nèi)部使用與SAM類似的技術(shù),用于標(biāo)記照片、審核違禁內(nèi)容以及確定向Facebook和Instagram用戶推薦哪些帖子等。公司表示,SAM的發(fā)布將擴大對這類技術(shù)的應(yīng)用。
SAM模型和數(shù)據(jù)集將在非商業(yè)許可下提供下載。用戶在將自己的圖像上傳到附帶的原型時,也必須同意僅用于研究目的。
Meta計劃在今年年底前將其專有的生成式人工智能商業(yè)化,用于生成廣告圖像。Meta公司首席技術(shù)官安德魯·博斯沃思(Andrew Bosworth)在東京接受采訪時表示:"我們在人工智能方面的投資已經(jīng)超過十年,并擁有世界上領(lǐng)先的研究機構(gòu)之一。我們有一個龐大的研究機構(gòu),有數(shù)百人。"