大腦如何成為AI的終極老師?解密「模組化」學習的驚人力量
近年來,AI的進化速度令人瞠目結舌,從下棋到畫圖,幾乎無所不能。但你有沒有想過,有一個「智慧系統」在很多方面仍然遙遙領先,那就是我們頭顱裡的大腦。即使給予相同的學習資料,大腦在學習新事物的速度,以及「舉一反三」到全新情境的能力上,常常讓最頂尖的AI也望塵莫及。
在新興的「神經人工智慧 (NeuroAI)」領域,科學家們正努力想解開這個謎題:大腦的「獨門祕訣」到底是什麼?如果我們能弄懂大腦高效學習的原理,或許就能打造出更通用、更聰明的AI。
想像一下,你和你的朋友拿到同一組數據點,要找出其中的規律。你可能直覺地認為這是一條直線,很快就畫出了一條趨勢線;而你的朋友可能覺得這是一條曲線,花了更多時間去擬合一個複雜的二次方程式。你們對數據的「內建假設」——也就是所謂的「歸納偏見 (inductive bias)」——決定了你們學習的效率和預測的準確度。
研究者們猜測,大腦之所以如此強大,是因為它演化出了一套非常適合理解真實世界的歸納偏見。其中一個最重要的偏見,可能就是「模組化架構」。
「模組化」聽起來很學術,但概念很簡單:與其讓一個龐大的「通才」網路處理所有問題,不如建立一個由「專家」組成的團隊,每個專家模組專注於解決任務的某個特定部分。例如,在開車時,你大腦裡可能有個模組專門判斷車速,另一個模組負責辨識路上的行人,還有一個模組整合這些資訊來決定何時該踩剎車。
這種分工合作的好處顯而易見:每個專家都能深度學習自己的領域,團隊協作起來也更有效率,更容易理解任務背後的複雜因果關係。為了驗證這個想法,研究者設計了一場虛擬世界的導航競賽。
研究者設計了一個類似電玩的任務:受試者(包括猴子和AI agent)被放在一個空曠的虛擬平面中央(圖1)。一個「目標」會短暫出現(僅300毫秒!)然後消失,受試者必須憑記憶,操作搖桿移動到目標位置並停下。
![]() |
圖1 |
這個任務的難點在於,環境中沒有任何固定的地標可以參考。你唯一能依賴的,是地面上快速閃過的紋理,也就是所謂的「光流 (optic flow)」,就像你從火車窗戶看著地面飛逝的感覺一樣。你必須透過這種光流來感知自己的移動,並在腦中不斷更新自己的位置這個過程稱為「路徑整合 (path integration)」。
要教AI玩這個遊戲,研究者採用了強化學習中經典的「演員-評論家 (Actor-Critic)」模型。你可以把它想像成一個學徒(演員)和一位導師(評論家)的組合,演員 (Actor)負責「玩遊戲」,根據目前的觀察和內心對自己位置的「信念」,決定下一步要怎麼移動。評論家 (Critic)負責「打分數」,它會評估演員的每一步走得好不好,並給出回饋,幫助演員調整策略,以獲得最終的獎勵。
接著,研究者打造了兩種不同架構的AI玩家來進行對決:
1. 整體式AI (Holistic Agent):像一個「通才」,它只有一個巨大的神經網路,所有資訊都混在一起處理,試圖同時搞定「我在哪裡?」和「我該怎麼做?」。
2. 模組化AI (Modular Agent):像一個「專家團隊」。研究者透過架構設計,強制它分工合作:
- 記憶專家 (RNN):一個具備記憶能力的循環神經網路,專門負責整合過去的動作和現在的光流,來計算「我現在最可能在哪裡?」這個核心信念。
- 決策專家 (MLP):一個無記憶的多層感知器,它接收來自記憶專家的位置信念,然後專心做出「下一步該怎麼走?」的最終決策。
這個設計確保了信念的計算和行動的決策在兩個獨立的模組中進行,模擬了研究者假設的大腦分工模式。
訓練開始後,結果非常明顯。模組化AI不僅學得更快,而且行為軌跡也更有效率、更自然,看起來非常像真實猴子的移動路徑!(見圖2)相比之下,整體式AI的軌跡則顯得笨拙且繞路。這表明,模組化的設計提供了一個更優質的「訓練信號」,讓AI能學到更佳的策略。
學得快還不夠,真正的智慧體現在「泛化」能力上。於是,我們給AI和猴子出了一道難題:在不告知它們的情況下,把搖桿的「增益」調高1.5倍甚至2倍。這就好比你習慣開家裡的房車,突然讓你去開一輛油門極度靈敏的跑車,如果還用同樣的力道去踩油門,肯定會失控衝過頭。
整體式AI果然「翻車」了,它們嚴重地「過度射擊」,遠遠衝過了目標點。而模組化AI則展現了驚人的適應力,它們能夠快速調整自己的動作,路徑誤差非常小,表現幾乎和身經百戰的猴子一樣好!(見圖2)
![]() |
圖2 |
為什麼模組化AI的適應力這麼強?我們決定「打開AI的大腦」一探究竟。我們記錄了AI演員網路中「記憶專家 (RNN)」的神經活動,並嘗試從這些活動中「解碼」出AI當下認為的自身位置。
結果令人振奮:在搖桿增益改變的壓力測試下,模組化AI對自身位置的信念依然極度準確,彷彿內建了一個精準的GPS。而整體式AI的信念則出現了巨大偏差,它自己都「搞不清楚在哪裡」,自然無法做出正確的行動。(圖3)
![]() |
圖3 |
這項實驗證明了「分工合作」的力量。大腦演化出的模組化架構,並非偶然,而是一種極其高效的歸納偏見。它讓大腦(以及我們模仿它設計的AI)能夠:
1. 高效學習:將複雜問題拆解,讓專家模組專注解決,學得更快更好。
2. 靈活泛化:因為深刻理解了任務的底層變數(例如自身位置),所以在環境改變時,能夠靈活調整策略,而不是死記硬背。
這項發現為我們指明了方向:要打造真正通用的AI,或許我們不該一味地追求更大、更複雜的單一模型,而是應該回頭向大腦學習它那優雅而強大的「模組化」設計哲學。
撰稿人:潘嘉丞
Reference:
Zhang, R., Pitkow, X., & Angelaki, D. E. (2024). Inductive biases of neural network modularity in spatial navigation. Science Advances, 10(29), eadk1256.
留言
張貼留言