≥外媒報(bào)道,在生活中,我們可能會(huì)遇見這樣的尷尬事:兩個(gè)人在你身邊竊竊私語,說著你完全不懂的語言,突然間他們兩個(gè)捧腹大笑。這時(shí),你會(huì)很好奇他們到底在說什么,甚至開始擔(dān)心這兩個(gè)人是否將自己當(dāng)成了恥笑的對(duì)象,難道是自己牙齒里塞了韭菜被他們看到了?現(xiàn)在,我們馬上就要體會(huì)到這種尷尬了,因?yàn)轳R斯克的OpenAI實(shí)驗(yàn)室發(fā)現(xiàn),AI機(jī)器人有自己創(chuàng)造語言的能力。
≥《連線》雜志報(bào)道,OpenAI的研究人員注意到,在用某種語言訓(xùn)練計(jì)算機(jī)時(shí),系統(tǒng)并不能理解語言與現(xiàn)實(shí)世界的關(guān)系,因此讓AI擁有自己能感知到的語言非常重要,而最近OpenAI就實(shí)現(xiàn)了這一目標(biāo)。
上周,OpenAI發(fā)布了一篇研究論文,解釋了它們是如何讓AI機(jī)器人創(chuàng)造自己的語言并實(shí)現(xiàn)順暢交流的,而完成這一復(fù)雜任務(wù)的關(guān)鍵就是強(qiáng)化學(xué)習(xí)(reinforcement learning)技術(shù)。
強(qiáng)化學(xué)習(xí)其實(shí)就像主人訓(xùn)練自家寵物,關(guān)鍵在于獎(jiǎng)勵(lì)那些正確的行為。在AI機(jī)器人的訓(xùn)練中,就意味著研究人員需要了解到底哪些“獎(jiǎng)勵(lì)”可以幫AI機(jī)器人完成任務(wù)并將這種“獎(jiǎng)勵(lì)”延續(xù)下去。這樣一來,AI機(jī)器人為了得到“獎(jiǎng)勵(lì)”,就會(huì)不斷進(jìn)步去完成任務(wù),從而創(chuàng)造出用于內(nèi)部交流的語言。
在OpenAI的試驗(yàn)中,AI機(jī)器人被“染上了”紅色、綠色和藍(lán)色三種顏色。隨后它們會(huì)接到一個(gè)任務(wù),如在二維世界中尋找到達(dá)一個(gè)集合點(diǎn)的路徑。不過,研究人員在這項(xiàng)實(shí)驗(yàn)中并未給三個(gè)AI機(jī)器人詳細(xì)的指令詞典,因此這些機(jī)器人不得不自力更生,創(chuàng)造語言相互交流以完成任務(wù)。
最終,研究人員發(fā)現(xiàn),這些AI機(jī)器人成功的給自己賦予了文本特征,同時(shí)這個(gè)虛擬二維世界中的動(dòng)作和障礙也有了自己的文本特征,它們之間也因此實(shí)現(xiàn)了順暢的交流。
一直擔(dān)心AI崛起毀滅人類的馬斯克,看到這一結(jié)果會(huì)不會(huì)更加擔(dān)憂呢?
投稿郵箱:chuanbeiol@163.com 詳情請(qǐng)?jiān)L問川北在線:http://fishbao.com.cn/