當突觸學會等待:海馬的秒級學習與信貸分配之謎


在大腦如何進行「credit assignment(信貸分配)」的研究中,一直存在一個關鍵難題:
神經元活動與行為結果之間往往相隔幾秒甚至幾十秒,但突觸可塑性(如 STDP)通常只作用在毫秒級。這使得行為導向的學習機制難以用傳統的突觸規則解釋。Cone、Clopath 與 Costa 在 2025 年提出了這篇極具突破性的工作——他們以實驗上觀察到的Behavioral Timescale Synaptic Plasticity (BTSP)為基礎,建立了一個可數學解析的學習框架(generalized BTSP, gBTSP),成功將「秒級可塑性」轉譯成一套可以描述、推導與模擬的理論模型。
-------------------------------------------------------------------------------------
作者首先以實驗資料為基礎,提出一個廣義學習規則(式一):
式一:Pi(t)為樹突 plateau 函數、Wkernel為雙指數可塑性核、λWij 為異突觸抑制項

(式一)這個公式能精確再現海馬 CA1 實驗中測得的 BTSP 時間窗與學習強度,建立起「行為時間尺度可塑性」的理論基底。
圖1:gBTSP 核心方程與可塑性 kernel 模擬 vs 實驗曲線

當 gBTSP 用於前饋網路(CA3→CA1 類型)時,若整體活動低於閾值,就隨機觸發一個 plateau。

這種規則自然產生competitive learning(競爭式學習):每個神經元透過一次 plateau「佔領」一段空間,使整體網路的活動場均勻分佈於環境中。結果顯示,CA1 神經元能一-shot 形成 place field,並隨時間出現代表性漂移(representational drift),完全符合小鼠實驗的觀察。
---------------------------------------------------------------------------------------
當同樣的 gBTSP 規則用於具 seed neuron 的迴圈網路(CA3 類型)時,plateau 可快速塑造出一個低秩 recurrent 結構 Wrec=WdWeW_{rec}=W_dW_eWrec=WdWe。這種結構在訓練後自發形成環形吸引子(ring attractor),可支撐 pattern completion 與 memory replay,顯示 BTSP 具備在內部生成記憶 manifold 的能力。
圖2.1:seed–visible 網路結構
圖2.2: 2D模擬PC1–PC2 投影呈現環形 manifold

-----------------------------------------------------------------------------------------------
作者接著把 plateau 函數與傳統 delta rule 對比,推導出(式二),使 plateau 與任務誤差 εi(t)成正比。
式二

在這樣的監督式設定中,feed-forward 網路能在少於十次 trial 內完成目標場或軌跡學習(如 1D 位置辨識、2D 路徑追蹤)。plateau 出現率與誤差成反比——學得越好,plateau 越少——對應實驗中 EC3-CA1 系統的誤差調控現象。
圖3.1:目標 vs 實際輸出曲線

圖3.2:plateau 機率隨 trial 數下降

--------------------------------------------------------------------------------------
最後作者指出,gBTSP 可被視為梯度反傳(backpropagation)在生物神經中的局部近似:
它在秒級時間窗內透過 plateau 整合 pre/post 活動,實現局部誤差傳遞,但無法在深層回饋網路中精確傳遞全域梯度。這說明了為何 CA1 能進行快速地圖學習,而 CA3 需要更慢、更穩定的記憶鞏固機制——兩者在功能上形成互補。

這篇研究的價值在於,它首次從理論層面把「秒級突觸可塑性」與「credit assignment」結合起來,讓我們能以可計算的方式理解大腦如何在沒有反向梯度的情況下進行行為導向的快速學習。同時,它也揭示了神經可塑性在架構層面上的限制:BTSP 能讓前饋電路瞬間改變行為,但無法讓迴圈電路立即學會穩定的策略。這種差異,可能正是海馬在記憶形成中「快與慢」兩階段運作的生理根據。

聲明:本文由ChatGPT協助撰寫及確認


撰稿人:周峻廷


原始論文:Cone, I., Clopath, C., & Costa, R. P. (2025). Credit Assignment via Behavioral Timescale Synaptic Plasticity: Theoretical Frameworks. bioRxiv, 2025-06.

留言