來源:新浪VR
語言是人類最基本的交際工具,人類社會的運行和發展離不開語言。我們通過語言來進行的人際互動、交換信息。說話者發出“語言信息”,受話者接受信息并在大腦中經過處理,最后“反饋信息”。那么,這種能力是否能運用于人工智能呢?是否可以讓機器人也學會根據自己的需要發出命令指導對方實踐?
研究員們通過實踐,在一個基于文本的冒險游戲中結合自然語言處理和強化學習技術,向機器展示如何使用語言作為工具。一個通過與角色對話完成文本冒險游戲任務的人工智能不僅學會了如何做事,還學會了如何讓別人做事。該系統向機器使用語言實現目標邁出了一步。
為了構建一個有目的言語的人工智能,來自亞特蘭大佐治亞理工學院(Georgia Institute of Technology)和Facebook人工智能研究中心(Facebook AI Research)的研究人員結合了來自自然語言處理(natural-language processing)和強化學習(reinforcement learning)的技術。
為了測試他們的方法,研究人員在一款名為LIGHT的基于文本的多人游戲中訓練他們的系統。LIGHT是Facebook去年開發的,用于研究人類和人工智能玩家之間的交流。游戲設定在一個幻想主題的世界里,有成千上萬的眾包對象、角色和地點,通過屏幕上的文字進行描述和交互。玩家(人或電腦)通過輸入諸如“擁抱向導”、“打龍”或“摘掉帽子”等命令來行動。他們還可以和聊天機器人控制的角色交談。
為了給出人工智能做事情的理由,研究人員增加了大約7500個眾包任務,這并不包括在最初版本的《光》中。最后,他們還創建了一個知識圖(一個主題-動詞-對象關系的數據庫),為AI提供關于游戲世界和游戲角色之間聯系的常識信息,比如商家只有在警衛是朋友的情況下才會信任他們。游戲現在有動作(比如“上山”和“吃掉騎士”)來完成任務(比如“建立龍所能獲得的最大的寶藏”)。
將所有這些結合在一起,他們訓練人工智能僅僅通過語言來完成任務。要執行動作,它可以為該動作鍵入命令,也可以通過與其他字符對話來達到相同的目的。例如,如果人工智能需要一把劍,它可以選擇偷一把或說服另一個角色交出一把。
目前,這個系統還只是個玩具。它的態度可能很直率,但將自然語言處理與強化學習相結合是一個令人興奮的操作,它不僅可以使聊天機器人更智能地對話,而且可以幫助我們對“充滿語言的世界是如何運作的”這一思考進行更豐富且深入地理解。