來(lái)源:新浪VR
語(yǔ)言是人類最基本的交際工具,人類社會(huì)的運(yùn)行和發(fā)展離不開(kāi)語(yǔ)言。我們通過(guò)語(yǔ)言來(lái)進(jìn)行的人際互動(dòng)、交換信息。說(shuō)話者發(fā)出“語(yǔ)言信息”,受話者接受信息并在大腦中經(jīng)過(guò)處理,最后“反饋信息”。那么,這種能力是否能運(yùn)用于人工智能呢?是否可以讓機(jī)器人也學(xué)會(huì)根據(jù)自己的需要發(fā)出命令指導(dǎo)對(duì)方實(shí)踐?
研究員們通過(guò)實(shí)踐,在一個(gè)基于文本的冒險(xiǎn)游戲中結(jié)合自然語(yǔ)言處理和強(qiáng)化學(xué)習(xí)技術(shù),向機(jī)器展示如何使用語(yǔ)言作為工具。一個(gè)通過(guò)與角色對(duì)話完成文本冒險(xiǎn)游戲任務(wù)的人工智能不僅學(xué)會(huì)了如何做事,還學(xué)會(huì)了如何讓別人做事。該系統(tǒng)向機(jī)器使用語(yǔ)言實(shí)現(xiàn)目標(biāo)邁出了一步。
為了構(gòu)建一個(gè)有目的言語(yǔ)的人工智能,來(lái)自亞特蘭大佐治亞理工學(xué)院(Georgia Institute of Technology)和Facebook人工智能研究中心(Facebook AI Research)的研究人員結(jié)合了來(lái)自自然語(yǔ)言處理(natural-language processing)和強(qiáng)化學(xué)習(xí)(reinforcement learning)的技術(shù)。
為了測(cè)試他們的方法,研究人員在一款名為L(zhǎng)IGHT的基于文本的多人游戲中訓(xùn)練他們的系統(tǒng)。LIGHT是Facebook去年開(kāi)發(fā)的,用于研究人類和人工智能玩家之間的交流。游戲設(shè)定在一個(gè)幻想主題的世界里,有成千上萬(wàn)的眾包對(duì)象、角色和地點(diǎn),通過(guò)屏幕上的文字進(jìn)行描述和交互。玩家(人或電腦)通過(guò)輸入諸如“擁抱向?qū)?rdquo;、“打龍”或“摘掉帽子”等命令來(lái)行動(dòng)。他們還可以和聊天機(jī)器人控制的角色交談。
為了給出人工智能做事情的理由,研究人員增加了大約7500個(gè)眾包任務(wù),這并不包括在最初版本的《光》中。最后,他們還創(chuàng)建了一個(gè)知識(shí)圖(一個(gè)主題-動(dòng)詞-對(duì)象關(guān)系的數(shù)據(jù)庫(kù)),為AI提供關(guān)于游戲世界和游戲角色之間聯(lián)系的常識(shí)信息,比如商家只有在警衛(wèi)是朋友的情況下才會(huì)信任他們。游戲現(xiàn)在有動(dòng)作(比如“上山”和“吃掉騎士”)來(lái)完成任務(wù)(比如“建立龍所能獲得的最大的寶藏”)。
將所有這些結(jié)合在一起,他們訓(xùn)練人工智能僅僅通過(guò)語(yǔ)言來(lái)完成任務(wù)。要執(zhí)行動(dòng)作,它可以為該動(dòng)作鍵入命令,也可以通過(guò)與其他字符對(duì)話來(lái)達(dá)到相同的目的。例如,如果人工智能需要一把劍,它可以選擇偷一把或說(shuō)服另一個(gè)角色交出一把。
目前,這個(gè)系統(tǒng)還只是個(gè)玩具。它的態(tài)度可能很直率,但將自然語(yǔ)言處理與強(qiáng)化學(xué)習(xí)相結(jié)合是一個(gè)令人興奮的操作,它不僅可以使聊天機(jī)器人更智能地對(duì)話,而且可以幫助我們對(duì)“充滿語(yǔ)言的世界是如何運(yùn)作的”這一思考進(jìn)行更豐富且深入地理解。