解密 RC-HC 儲備池運算:機器人如何長出大腦般的隱含空間直覺?

傳統觀念認為,自主機器人若要在複雜且未知的環境中順利導航,必須依賴耗費龐大算力的 SLAM(同時定位與建圖)技術。在這種機制下,機器人需要裝備昂貴的雷射掃描儀器,像繪圖員一樣將環境的每一個幾何細節完整記錄下來,建立出精確的 3D 地圖。而在神經網路的訓練上,要讓遞迴神經網路(RNN)記住環境的時空特徵,通常也離不開容易陷入局部最佳解、計算過程繁瑣的「沿時間反向傳播」(BPTT)演算法。

但實際上,生物(例如老鼠)在探索迷宮時,大腦根本不需要預先載入一張精密的幾何地圖,也不依賴完美的測距儀器。牠們憑藉的是神經系統中極具適應性的「隱含認知地圖」(Implicit map)機制。

那麼,如果機器人沒有內建地圖,且身上只有幾個低精準度、易受雜訊干擾的紅外線感測器,它怎麼可能光靠幾次人類的「示範」,就能學會在擁有多個房間的複雜環境中穿梭,甚至被瞬間移位都不會迷失?答案藏在一個名為 RC-HC(儲備池運算階層式控制器) 的仿生雙模組架構中。
大腦小腦的運作機制給了機器學習極大的啟發。RC-HC 系統能透過模仿學習實現小數據訓練與建立強大空間認知能力的根本秘密,是以下三個機制彼此合作:

儲備池運算 (Reservoir Computing) —— 捨棄繁瑣訓練的「高維度特徵反射池」 RC-HC 徹底拋棄了傳統 RNN 必須不斷調整內部所有突觸權重的做法。它的內部是一群隨機生成且 連接權重完全固定不變 的神經元網絡(即「儲備池」)。
當低精確度的感測器訊號輸入時,這個儲備池會將簡單的低維度訊號瞬間投影到極度豐富的高維度特徵空間中。系統 唯一需要訓練的只有「輸出層」,只要透過極快的線性迴歸就能找出對應目標的最佳解,完美避開了 BPTT 演算法惱人的收斂難題與龐大計算負擔。
Figure 1:儲備池運算 (Reservoir Computing) 網路。儲備池如同一個時間核心 (Temporal kernel),能將輸入的訊號投影到豐富的高維度特徵空間中。圖中實線代表固定不變的連接,虛線則代表唯一需要被學習(訓練)的輸出層連接。

定位模組 (Localization Reservoir) —— 具備大腦位置細胞功能的「慢速認知地圖」 這是系統中負責建構空間概念的主力網路。為了讓機器人能在沒有里程計(Odometry)輔助的情況下掌握「自己在哪裡」,定位模組被設定為擁有極低的洩漏率(Leak rate, α=0.01),讓它在處理資訊時處於「慢速時間尺度」(Slow timescale)。 這種慢速機制賦予了網路強大的短期記憶能力。當機器人跟著監督者探索環境時,這個模組能學會根據當下模糊的感測訊號,精準預測「當下所在的房間」與「之前造訪過的房間」。這完美重現了齧齒動物大腦海馬迴中 「位置細胞」(Place cells) 的空間表徵能力,成功在網路內部建立起環境的隱含地圖。
Figure 2:階層式架構 (RC-HC) 示意圖。圖中展示了結合定位與導航的雙模組系統。導航與定位儲備池(圓圈處)均為隨機生成且不需訓練的遞迴網路;感測器輸入會同時饋送給兩個儲備池,而導航模組還會額外接收來自定位模組的位置預測資訊與目標位置來決定馬達輸出。

導航模組 (Navigation Reservoir) —— 整合反射與決策的「快速驅動中樞」 有了空間認知,機器人還需要做出即時的移動決策。導航模組是一個處於「快速時間尺度」(Fast timescale)的網路,擁有高洩漏率(α=1),這讓它能極快地對環境的瞬間變化做出反應。 它會同時接收三個方向的資訊:當下的感測器數據、目標位置指令,以及由「定位模組」傳遞過來的空間認知預測。它將審慎的「高階路徑規劃」(如決定走向哪個房間)與反射性的「低階避障」(如閃避眼前的牆壁)完美融合在一起,直接輸出左右輪的馬達控制訊號。
當然,這個仿生動態學習系統也具備極強的強健性與適應力。泛化能力(Generalization)的展現會在面對突發狀況時發揮巨大作用。
Figure 6:環境 E1 中由 RC-HC 控制器驅動的機器人軌跡。特別是圖 (c) 展現了「綁架測試」(Kidnapping) 的過程:機器人在房間 3 準備前往房間 1 時,突然被外力瞬間移動 (綁架) 到了房間 2。軌跡顯示,機器人能在幾步之內漂亮地從綁架中恢復,重新定位並直接駛回目的地房間 1。

面對這種未知干擾,即使機器人突然被外力瞬間移動到訓練計畫外的地點,它也不會當機。憑藉儲備池的短期記憶與定位網路的空間預測,它能迅速重新定位自己,重新規劃出正確的路線,並成功抵達最終目標。這證明了它並非單純死背一段路徑,而是真正內化了該環境的時空法則。

聲明:本文由ChatGPT協助撰寫及確認


撰稿人:周峻廷


Reference: Antonelo, E. A., & Schrauwen, B. (2010). "Supervised learning of internal models for autonomous goal-oriented robot navigation using reservoir computing". In 2010 IEEE International Conference on Robotics and Automation (pp. 2959-2964). IEEE.

留言