在充滿不確定的世界中尋找最佳解
人類小小的大腦,在充滿變化的世界中,每天都要面對無數充滿不確定的事情。小至估計桌上一枝筆的寬度,大至從教授的表情來猜測自己的工作有沒有做好,甚至是預測股票市場的漲跌,我們時常需要基於不完整、模糊或充滿雜訊的訊息來做出判斷。於是神經科學家們開始思考:大腦究竟是如何處理這些「不確定性」的?
這篇文章將帶你一探究竟:首先,我們從數學的角度出發,看看理想上我們該如何運算這些不確定度;接著,我們將目光轉向大腦,探討神經元是如何在物理層面上實作這些複雜的數學計算;最後,我們會提出一些科學家目前仍在積極探索的謎團與方向。
當數學公式變成思考模式:解密貝氏推論
要談大腦如何處理機率,我們得先回憶一下高中數學課本裡的常客——貝氏定理(Bayes' Theorem)。在數學上,它是一個用來計算條件機率的嚴謹公式。它的經典數學式長這個樣子:
$$P(A|B) = \frac{P(B|A) \times P(A)}{P(B)}$$
這個公式雖然簡短,卻完美對應了我們在面對未知時的思考過程。當我們將這套數學邏輯應用於日常的學習與判斷時,便稱為貝氏推論(Bayesian Inference)。它的核心概念非常直觀:「根據新的證據,來動態更新我們原有的信念」。若將此公式套用在貝氏推論中,各項參數所代表的意義如下:
--先驗機率(Prior, $P(A)$):我們原有的信念。在還沒看到任何新證據 $B$ 之前,我們根據過去經驗認為事件 $A$ 發生的機率。
--概似度(Likelihood, $P(B|A)$):新證據的支持度。假設事件 $A$ 真的發生了,那我們觀察到眼前證據 $B$ 的機率有多高。
--後驗機率(Posterior, $P(A|B)$):更新後的信念。這正是我們最終想求得的結果——在結合了新證據 $B$ 之後,我們把事件 $A$ 發生的機率「更新」為多少。
--邊際機率(Marginal Probability, $P(B)$):作為分母,它通常是一個用來將總機率標準化(確保所有可能性加總為 1)的常數。
接下來,讓我們以估計「筆的寬度」為例,來拆解大腦在推論的每一個步驟中,是如何對應並運算這些資訊的。
假設筆的真實寬度為 $w$,在這個任務中,貝式推論的運算過程如下:
1. 先驗機率(Prior, $P(w)$):在還沒看見或摸到筆之前,根據你過去的經驗,這枝筆寬度是多少的機率分布。
2. 概似度(Likelihood):這是感官收集到的新證據。
--眼睛看見了筆,產生視覺測量值 $w_v$。大腦由此得出視覺概似度 $P(w_v|w)$,代表在真實寬度為 $w$ 的情況下,得到這個視覺畫面 $w_v$ 的機率。
--手指捏住了筆,產生觸覺測量值 $w_t$。大腦由此得出觸覺概似度 $P(w_t|w)$。
3. 後驗機率(Posterior, $P(w|w_v, w_t)$):最後,大腦必須將這些資訊結合,得出在同時擁有視覺與觸覺證據下,最可能的真實寬度機率。根據貝氏定理,假設視覺與觸覺的雜訊是獨立的,大腦是透過將這些機率相乘來得到結果(分母可視為常數,用來將總機率正規化為 1):
$$P(w|w_v, w_t) = \frac{P(w_v|w) \times P(w_t|w) \times P(w)}{P(w_v, w_t)}$$
科學家發現,人類的行為在很多時候都具有貝氏推論特質。然而,這引出了一個巨大的謎團:我們的大腦是一團由神經細胞組成的柔軟物質,既沒有內建計算機,也沒有寫滿數學公式的黑板。那麼,貝氏推論到底是如何在大腦的物理結構中運作的?
這衍生出了兩個必須被解答的核心疑惑:
1. 大腦如何「編碼」機率?(神經元要怎麼表達一個連續的機率分布?)
2. 大腦如何「運算」機率?(神經元要怎麼進行上述公式中機率的「相乘」?)
神經元如何算數學?對數機率編碼
在前面的貝氏公式中我們看到,如果要結合兩個獨立的線索來得到最準確的猜測,大腦必須將視覺概似度與觸覺概似度相乘。但神經細胞要怎麼執行「乘法」?
這時候,讓我們引入一種非常聰明的神經編碼假設:對數機率編碼(Log Probability Code)。
在神經科學中,我們常用「放電頻率(Firing Rate)」來衡量神經元的活躍程度,也就是一個神經元在一秒內發出幾個電位脈衝(Spikes)。如果大腦使用的是對數機率編碼,這意味著神經元的放電頻率 $r$,正比於機率的對數值(Log Probability)。 用數學式簡單表達就是:$r \propto \log(P)$
為什麼大腦要大費周章取對數呢?要回答這個問題,我們要用到高一學的對數律:兩數相乘的對數,等於兩對數相加($\log(A \times B) = \log(A) + \log(B)$)以及計算神經科學中經典的放電頻率模型(Firing Rate Model):
1. 上游神經元輸入: 視覺神經元放電頻率 $R_{vision}=k\log(P_{vision})$ ;觸覺神經元放電頻率 $R_{touch} = k\log(P_{touch})$。$k$ 是一個常數(表示正比關係)。
2. 下游神經元的整合: 根據神經科學的放電頻率模型,下游神經元的活動狀態會隨著接收到的總輸入電流($\sum I$)而改變:
$$\tau \frac{dR_{combined}}{dt} = -R_{combined} + F(\sum I)$$
這裡的 $\tau$ 是神經元的時間常數,$R_{combined}$ 是下游神經元的放電頻率,$F$ 是非線性的轉換函數(Activation function,常見形式為「ReLU」),而 $\sum I$ 則是所有上游神經元傳遞過來的輸入電流總和(包含視覺 $I_{vision}$ 與觸覺 $I_{touch}$)。
當神經元的活動達到穩定狀態(Steady state)時,放電頻率不再隨時間變化,也就是 $\frac{dr}{dt} = 0$。此時,假設轉換函數 $F$ 處於簡單的線性區間($F(x) \approx x$),這個動態方程式就可以大幅簡化為:
$$R_{combined} \approx \sum I = I_{vision} + I_{touch}$$
在神經網路中,突觸接收到的輸入電流,是由上游神經元的放電頻率乘上突觸權重(Synaptic weight)而來。如果我們假設這裡的突觸權重剛好都是 1(也就是 $I_{vision} = R_{vision}$,且 $I_{touch} = R_{touch}$),那麼下游神經元的放電頻率就會直接變成上游頻率的相加:
$$R_{combined} \approx R_{vision} + R_{touch}$$
3. 數學推導完成貝氏相乘: 最後,我們把第一步的「對數機率」代入剛才算出來的相加結果中:
$$R_{combined} \approx k(\log(P_{vision}) + \log(P_{touch}))$$
根據對數相加的特性,這一步自然而然地在數學上等價於兩機率的內部相乘:
$$R_{combined} \approx k\log(P_{vision} \times P_{touch})$$
透過這套機制,下游神經元只需要在細胞膜上遵循基本的物理定律做「突觸電流加總」,就在不知不覺中完成了貝氏機率相乘運算(算出了後驗機率的分子)!
更多可能性:群體編碼與時間累積
上面提到的單一神經元對數編碼非常優雅,但目前的科學界對於大腦究竟如何編碼機率,還有許多熱烈的討論與更進階的假說。
例如,除了單一神經元的表達,我們其實也可以用一群神經元的活動(Probabilistic Population Codes, PPC)來共同表達機率分布。大腦中的神經元很少單打獨鬥,當我們用一群具有不同偏好的神經元(例如有的偏好寬一點,有的偏好窄一點)一起來編碼時,這樣的「群體智慧」不僅能容忍單一神經元偶爾的錯誤(抗雜訊能力強),還能表達更複雜、形狀不規則的機率分布,這比起只用一顆神經元來說,更符合真實大腦複雜的網絡結構。
另外,還有一群科學家提出了截然不同的看法:取樣編碼(Sampling-based codes)。他們認為,機率不是由某個「瞬間」的神經活動強度(放電頻率)來決定的;相反地,神經元的每一次放電,都像是在對外在世界進行一次「抽樣」。在這種假說下,我們必須累積一段時間的資訊,看著神經元在不同狀態間跳躍,才能在腦海中描繪出完整的機率分布面貌。這就像是要知道一顆骰子是不是公正的,你不能只看它擲出一次的結果,而是要累積擲個一百次才能知道機率分布。
大腦這台由神經網絡構成的機率計算機,究竟隱藏了多少演算法的秘密?從簡單的感官結合,到複雜的抽象因果推理,貝氏大腦假說為我們打開了一扇全新的窗。如果你對大腦如何在這不確定的世界中算數學感到好奇,這門結合了神經科學、心理學與機器學習的學問,絕對值得你繼續深入探索!
【編按】本文由人類提供學術文獻與架構指引,並由 Germini 協助統整與轉譯,再由人類進行細節較正。
撰文:林明樺
參考文獻:Pouget, A., Beck, J. M., Ma, W. J., & Latham, P. E. (2013). "Probabilistic brains: knowns and unknowns". Nature neuroscience, 16(9), 1170-1178.

留言
張貼留言