自然語言AI的展望

自然語言技術是個很大的課題,但也是AI研發常常會討論到的內容,若僅需透過平時自然對話就能使機械理解語意,那麼AI應用更甚至是開發將不再生冷,可為更多面向更多不同能力層的人們帶來協助與便利。

但要能達成像鋼鐵人中賈維斯那樣智能程度自然語言理解能力,那現今科技還有漫漫長路,但是近期或許GOOGLE悄悄帶來了些許曙光。再講GOOGLE這新案例之前,先來聊聊Natural Language Processing吧! 自然語言處理這方面,目前大家最常用的多半就是語音辨識了!但是我們理想中的互動,不該是一個指定口令一個動作,這就是為什麼不論是google助理抑或是SIRI在生活情境上多少都會有種笨笨的感覺,近來AI在辨識與精準翻譯上皆有重大的發展,但都卡在最後但最重要的一關,語意理解以及對話決策,尤其是生活中常常是破碎的語意,更甚至關鍵字零散的語句,對於語意理解以及對話決策就會是個難點,而目標是使AI能有所謂的「常識」,使其能讀懂「空氣」、讀懂「含意」,並且執行。

而開頭講到的GOOGLE的發展,便是旗下Everyday Robots透過Pathways (PaLM)語言模型開發的機器人,可評估能力、環境、任務並切分任務目標,更自然的完成,且其語意理解以及對話決策有了大程度進展。舉例來說,如果可樂灑出來了,使用者可以提出“I spilled my Coke, can you bring me something to clean it up?或者“I spilled my Coke, can you bring me a replacement?等不同指令,都能立刻改變機器人行為模式,並且前者的命令並無特意指定清掃用品,其會分析環境並最終將海綿或是抹布遞給使用者,並且每次學習新技能僅要一台學會,上傳至統一雲端上,每台配備PaLM模組的機器皆可迅速轉移能力並且複製。(目前這是台展望廚房小能手的機器人)

更甚至微軟還開發能透過自然語言控制便能自動coding的機器呢!根本是碼農解放神器,不過這些科技有些都尚在研發階段,且自然語言使用上,總會碰到一個最大的問題就是語言的多樣性,要能最終符合所有人種使用,那麼前端的語意理解,語言翻譯解析,都會是個漫長的作業,而最終的重組語句理解與決策也是機器是否夠「智能」的關鍵。
圖一,AI 處理語音指令的過程:語音辨識 (Automatic Speech Recognition; ASR)、語意理解 (Natural Language Understanding; NLU)、對話決策 (Dialogue Management)、以及語言生成 (Natural Language Generation; NLG)(圖源/科技大觀園 陳縕儂提供)

圖二,Google Everyday Robots 的廚房機器人

圖三,Google Everyday Robots 的廚房機器人

興趣向延伸閱讀推薦: Natural Language Processing | SpringerLink   更為詳細解釋Natural Language Processing 各項用法以及流程,並且目前已有許多工具包可以在python上編程。


撰文:徐楷昕


留言