12月27日消息據Appleinsider報道,蘋果日前發(fā)布了其首份關于人工智能(AI)的學術論文,其中主要描述了在計算機視覺系統(tǒng)中提高圖像識別的方法,這標志著向來以保密著稱的蘋果終于透露了其AI研究的全新方向。
這篇報告名為“通過對抗性訓練向模擬和無監(jiān)督圖像學習”。它是11月中旬提交復審的,最后于12月22日通過康內爾大學圖書館出版。12月初時,蘋果曾表示不會再禁止員工發(fā)布有關AI的研究報告。而在不到一個月的時間,蘋果就兌現了這樣承諾。
蘋果在報告中描述了一種可用于改進計算機視覺算法訓練的新興技術,在機器學習研究中,使用合成圖像進行神經網絡訓練要比真實圖像更有效。原因在于合成圖像已經被標記和注釋,更加省時省力。舉例來說,眼部或手部的合成圖像都有自動注釋,而描述類似物品的真實圖片算法并不熟悉,因此需要人類操作員進行描述。
不過報告也點出了使用合成圖像的弊端,可能會導致神經網絡的算法與真實世界中的嘲產生偏差。因為計算機生成內容有時候不夠真實,導致神經網絡學習僅僅能夠了解到合成圖像中的細節(jié),并不能完整地認識到真實世界中的圖像,無法為算法提供精確的學習。
為了解決這個問題,蘋果研究人員提出了解決方案,即通過一種“模擬+無監(jiān)督”的學習方式來提高合成圖像的真實感。蘋果還研發(fā)出一種名為“生成對抗網絡(GAN)”的新型機器學習技術,通過讓兩個神經網絡彼此對抗來生成更加逼真的圖像。在最近取得的進展中,這個過程產生的圖像甚至能與高清照片相媲美。
管蘋果的AI研究不一定立刻變成消費性技術,但值得關注的是,蘋果選擇將其改進的GAN用于評估凝視和手部姿勢。此外,該公司稱將來能夠利用視頻輸入代替靜態(tài)圖像訓練算法。
蘋果首份AI報告的第一作者是蘋果公司研究員阿希什·什里瓦斯特瓦(Ashish Shrivastava),其他參與起草報告的工程師還有托馬斯·費斯(Tomas Pfister)、恩杰爾·圖澤爾(Oncel Tuzel)、Wenda Wang、拉斯·韋伯(Russ Webb)以及蘋果AI研究主管喬!ぬK士侃(Josh Susskind)。
蘋果這次公開了其第一份人工智能報告意味著該公司邁出了重要的一步。多年以來,蘋果對其在人工智能領域的研究失重保密,沒有透露過任何的信息,這一舉措也遭到了人工智能研究社區(qū)的評判。人工智能軟件也正變得必不可少,它幾乎被應用到了所有的應用程序中,在蘋果最新的iPhone 7手機的拍照功能以及其各種互聯網服務中都應用到了人工智能軟件。
投稿郵箱:chuanbeiol@163.com 詳情請訪問川北在線:http://fishbao.com.cn/