昆蟲是怎麼「看路」的?——從螞蟻導航,論大腦如何自己生出「高階視覺」


本次介紹的為於2025年6月份所發表的文章 “Lateralised memory networks may explain the use of higher-order visual features in navigating insects”,該文章主要探討高階視覺特徵 (higher-order visual features) 或者說所謂的「風景」是如何被記住與利用的。

## 螞蟻怎麼記得回家的路?
在很多實驗裡,螞蟻只要走過一次從巢穴到食物的路,下次就能憑「風景」回家。
研究者發現,螞蟻並不是記每一個像素,而是依賴比較抽象的視覺特徵:
例如「場景中有多少特定形狀在視野左邊、右邊」這種分佈資訊。
行為學中有一個常用的量:**質量分數位置 (fractional position of mass, FPM)** 大致可以想像成:「如果把眼前看到的特定形狀當成重量,它的重心落在視野的哪一側、哪個角度」。
當研究者改變牆上圖形的位置或形狀,只要讓 FPM 跟訓練時差不多,螞蟻就會朝相似的方向走。依此,似乎螞蟻在腦中算出了一個幾何重心。問題在於從已知的神經解剖來看,昆蟲大腦中處理視覺記憶的蕈狀體 (mushroom bodies, MBs) 所接收到的訊號,其實比較像視網膜的直接視覺輸入,大致保留空間位置,不像已經被高階模組轉換為重心坐標。
這就引出一個核心問題:
「 昆蟲真的需要一個專門算FPM的高階視覺模組? 還是說,這種高階特徵其實可以自然地從既有神經網路裡湧現?」

## 螞蟻的大腦如何自己生出高階視覺?
研究者建立了一個模擬昆蟲蕈狀體構造的模型,目的是測試:螞蟻在導航中看似使用的 FPM 這種高階特徵,是否其實不需要大腦額外計算,而能自然從雙側記憶架構中生成。
模型採用360°全景視野輸入,左右視野分別投射到大腦的左右半側,每側的 Kenyon cells (KCs) 隨機且稀疏地接收視覺訊號,由抑制神經元確保活化比例固定。
學習過程使用反 Hebbian (anti-Hebbian) 規則:看得越多的圖越不新奇,讓 MBONs (mushroom body output neurons) 的輸出成為一種新奇度 (novelty) 指標。
導航決策依兩個量:
一是視圖整體新奇度是否低,二是左右新奇度是否平衡。
研究發現,真正能挑出螞蟻行為所對應方向的,是同時滿足這兩點的視角。
更重要的是在簡化情況下可證明:
當測試視圖的 FPM 與訓練時一致時,左右視野中訓練過的部分被測試形狀覆蓋的比例自然相等,由於 KCs 的連結是隨機而均勻,這會使左右半腦被重新喚起的記憶比例相同,最終讓左右 MBONs 的新奇度自動趨於平衡。
也就是說:
FPM 對齊的方向恰好是左右新奇度平衡的方向,而這個量不需要專門構造顯式生成,只要有左右分開的記憶+反Hebbian學習,就會自然浮現。
這證明螞蟻似乎具備的高階視覺幾何運算,不一定需要專門構造,而可能只是大腦雙側視覺記憶系統的副產物。

## 為什麼左右平衡會對應到 FPM 對齊?
研究人員採用一個簡化的模型與環境設定:
1. 訓練時,螞蟻面對一個長方形形狀。
2. 測試時,用另一個長方形(可能變寬、變窄),旋轉不同角度。
3. 左邊的像素大多投到左側蕈狀體,右邊的大多投到右側;兩側仍保留少量交叉投射。

在這種情況下,可以做一個幾何分析:
1. 把訓練與測試形狀在視野中的區域拆成四種:
    X:訓練和測試都在左邊有覆蓋。
    Y:只有訓練在左邊有覆蓋。
    W:訓練和測試都在右邊有覆蓋。
    Z:只有訓練在右邊有覆蓋。
2. FPM 對齊代表:
    - 測試的重心跟訓練一樣,也就是左邊被覆蓋的比例和右邊被覆蓋的比例以某種方式一致。
    - 就像一張照片的亮暗分布若左右對稱,你不需要計算重心,也能看出它“擺正了”
    - 用數學寫,可以得到一個條件,表示左、右訓練區域被測試形狀覆蓋的比例相等γ_L = γ_R。
3. 由於 vPN → KC 的連結是隨機且均勻的:
    - 左腦裡有多少 KC 在訓練時被某些左視野像素點亮,測試時又再被點亮,將與 γ_L 有關。
    - 右腦同理,與 γ_R 有關。
4. 如果 γ_L = γ_R,那麼:
    - 左、右半腦中曾經被學過,現在又被喚起的 KC 數量期望值相等。
    - 因為反Hebbian學習削弱的是看過的組合,所以左、右 MBON 的新奇度預期值也會相等。
綜合上述條件與假設會得到一個結論:
「 當測試視角剛好讓 FPM 對齊時,左右 MBON 的新奇度自然會趨向平衡。 」
於是,找左右新奇度最平衡的方向,就等同於找 FPM 對齊的方向。
故,FPM 這個看似高階的幾何量,其實不需要顯式計算,就自然藏在雙側記憶的結構裡。

## 導航功能構想:蕈狀體+中央複合體的合作
最後,他們假設各腦區具有的功能:
1. 蕈狀體 (MB)
    - 負責記住路上見過的風景
    - 用反 Hebbian 學習把看過的視圖變為低新奇度
    - 輸出一個視覺新奇度+左右平衡的訊號
2. 中央複合體 (central complex, CX)
    - 裡面的環狀結構(例如扇形體 fanshaped body)可以表示當前朝向與目標朝向,
    - 其他細胞(如 PFL2)讀取這些資訊,控制轉向方向與角度。
這篇研究提出的構想是:
菇狀體提供的是哪個視角看起來最像訓練時且左右最平衡的訊號,CX 再把這個視角轉換成一個具體的目標方向,透過運動系統,實現螞蟻的轉向與行走。

## 還缺什麼?
這個模型有大幅的簡化,也因此有幾個他們自己提出的限制:
1. 視覺輸入仍然很粗糙
    - 使用的是灰階、簡化幾何形狀,沒有紋理、深度、顏色等更複雜訊息。
    - 實際自然環境遠比實驗場複雜,但這也提供未來延伸的空間:
    在更複雜場景下,這種「雙側新奇度平衡」是否依然有效?
2. 菇狀體內部的迴圈與神經調質尚未納入
    - 實際菇狀體有 KC–KC 連結、多巴胺神經元調控獎賞與懲罰等機制。
    - 這些可能讓記憶更具選擇性,例如只強調與食物相關的視圖。
3. 中央複合體端的實作是「假說式」的
    - 雖然有很多來自果蠅的神經元研究支持 CX 參與方向與目標控制,
    - 但真正對接到由 MB 送來的導航訊號這件事,還需要更多實驗驗證。
總之,這篇研究顯示,螞蟻在視覺導航中所展現的高階幾何感知,可能不是額外長出一個專門算幾何的模組,而是大腦雙側記憶與新奇度比較的自然結果。這也導引到我們目前正熱門的機器學習的領域,像是很多特殊的功能,可能不需要精心設計的特殊結構或層,而是適當的整體結構與訊號流動,就能自然而然地獲得所需的功能。


撰文:黃峻緯


原始論文:Filippi, G., Knight, J., Philippides, A., & Graham, P. (2025). Lateralised memory networks may explain the use of higher-order visual features in navigating insects. PLOS Computational Biology, 21(6), e1012670.

留言