從昆蟲學習視覺導航--探索蜜蜂與蝗蟲如何啟發智慧機器人

自主導航(Autonomous Navigation)是機器人與動物生存及執行任務的核心能力。導航主要有兩大目標:目標接近(Goal Approaching)與避障(Collision Avoidance)。儘管昆蟲擁有比哺乳動物小許多的大腦,卻展現出卓越的導航能力,這引起了研究者將其機制應用於機器人導航的興趣。

本研究提出一種仿昆蟲自主導航演算法,整合蜜蜂的路徑積分(Path Integration, PI)機制與蝗蟲的巨型視動檢測神經元(Lobula Giant Movement Detector, LGMD)來實現目標接近與避障功能。透過模擬實驗,研究團隊驗證了該方法在靜態與動態環境中的有效性。

研究方法
1. 環境與代理機器人(Agent)設計
模擬環境為一個三維空間,包含靜態或動態障礙物,以及手動設置的家(起點)與食物點(目標)。Agent指的是在模擬環境中執行導航任務的虛擬機器人。在這篇論文中,代理機器人是一個抽象化的點,為帶有相機的點狀機器人,具備120°水平視場與105°垂直視場,透過視覺輸入驅動導航行為。
2. 目標接近:蜜蜂的路徑積分模型(圖一)
蜜蜂透過路徑積分來追蹤移動過程中的方向與距離,使其能夠高效返回巢穴。該機制基於一組CPU4神經元來記錄向量記憶,並透過CPU1神經元產生轉向訊號。
• 方向編碼:使用TB1神經元記錄當前朝向,並與前一時間步的方向作比較。
• 速度記錄:TN2神經元接收速度資訊,透過神經網路累積計算距離。
• 向量記憶:CPU4神經元累積距離與方向資訊,並用於生成指向家或目標點的向量。
• 運動控制:CPU1神經元計算轉向角度,使代理機器人按照目標向量導航。
此模型擁有靈活的向量導航,例如從起點前往不同目標點,或在記憶向量的基礎上生成捷徑。
3. 避障:蝗蟲的LGMD模型
蝗蟲利用LGMD神經元檢測潛在的碰撞威脅,並觸發迅速閃避行動。
• 光感受層(P):記錄視野內光強度變化,並通過時序差分計算變化率。
• 興奮層(E)與抑制層(I):前者直接接收P層輸入,後者則基於空間鄰近像素提供抑制訊號。
• 總和層(S)與門控層(G):計算視覺對象的膨脹程度並過濾雜訊。
• LGMD神經元:當視覺變化超過閾值時觸發避障反應。
• 運動控制:靜態障礙物時,代理機器人進行急轉閃避;動態障礙物時,代理機器人短暫停止,讓障礙物通過後再繼續行動。
圖一、蜂的路徑積分模型和蝗蟲的碰撞檢測模型。左側展示了路徑積分(PI)和局部運動檢測(LGMD)的神經網路及其對應的感覺-運動循環。右側面板則展示了目標接近和避障的範例,以及在特定時間步驟下模型輸出的神經激發情況。

結果分析
模擬環境包含兩個階段:
階段1(探索與記憶):代理機器人在無障礙環境中隨機移動,尋找食物點並記錄路徑向量。
階段2(自主導航):代理機器人從起點出發,根據向量記憶導航至所有食物點,並避開障礙物。
結果分析
(1) 靜態環境導航表現
• 代理機器人能成功利用PI機制完成目標導航,並透過LGMD有效避障。
• 在6-42個障礙物的測試環境下,避障成功率隨障礙物數量增加而略微下降。
(2) 動態環境導航表現
• 當障礙物移動時,代理機器人能根據LGMD避障策略做出合理反應。
• 代理機器人在障礙物密度較高時需耗費較長時間避障。
圖二

(a) Phase1 - exploring and vector memory ontogeny
圖二上圖:代理機器人處於階段1(探索階段)。代理機器人從起點開始隨機探索環境,並在過程中建立三個食物點的向量記憶(Vector Memory, CPU4)。這些探索路徑(橙線)是代理機器人如何在環境中尋找食物點並記錄其位置的過程。綠色線條顯示代理機器人回到起點的“回家”路徑,這也代表代理機器人利用已建立的向量記憶來導航。

(b) Phase2 - forging by retrieving vector memories
圖二下圖:展示了階段2(尋找食物並避開障礙物)。在這個階段,代理機器人依據從探索階段中獲得的向量記憶導航,尋找食物點並避開障礙物(黑色方塊)。紫色圓圈標示了LGMD神經元的閃避反應,即當代理機器人靠近障礙物時,LGMD模型會觸發警告並改變代理機器人的行進方向。
圖二下右圖:顯示代理機器人導航過程中如何隨時間調整路徑以避開移動的障礙物。顯示的時間進度(t = 520, t = 532 等)代表LGMD反應隨著代理機器人靠近障礙物而發生變化的過程。

圖三、整體導航結果分析

圖三為整體導航結果分析,說明如下:
• Nobs:障礙物數量。
• avg(LR)/step:每步驟的平均路徑長度。這表示代理機器人完成任務所走的總路徑長度的平均值。
• avg(T)/time-step:每步驟完成任務的平均時間。這顯示了代理機器人在完成導航任務過程中,每個步驟的平均時間花費。
• med(Collision):在導航過程中的碰撞次數的中位數。它反映了代理機器人避開障礙物的能力,數字越小表示碰撞越少。
• Static:靜態環境,障礙物位置不變。
• Dynamic:動態環境,障礙物會移動。
隨著障礙物數量的增加,平均路徑長度(avg(LR)/step)和完成時間(avg(T)/time-step)通常會增加,並且碰撞次數(med(Collision))也會有所上升,這顯示了障礙物數量對代理機器人導航性能的影響。

結論
本研究成功提出一種結合昆蟲靈感的導航演算法,並驗證其在靜態與動態環境中的有效性。結果顯示,路徑積分(PI)可有效實現目標接近,而LGMD模型能顯著降低碰撞風險。未來研究可考慮加入視覺記憶與多感官融合,進一步提升導航能力。


撰文:余雪淩


原始論文:Sun, X., et al., An insect-inspired model facilitating autonomous navigation by incorporating goal approaching and collision avoidance. Neural Networks, 2023. 165: p. 106-118.

留言