人類視覺迴路的簡單模型

當光線進入我們的眼睛,一趟精彩旅程就此展開,從視網膜經視神經通往外側膝狀體核(LGN),再至視覺皮質V1、MT(middle temporal visual area)、MST(medial superior temporal area),不過每個階段的細部迴路與功能都還有待生物學家的深入探究。因此現階段若要建造完整人類視覺迴路的網路模型,少不了假設與猜測。這邊要介紹的是一個以功能為出發點的模型設計。Oliver Layton是整個模型最主要的貢獻者,模型的主要目標是用來解釋一件我們已經習以為常的事──從視覺瞭解自身的運動狀態,比如說知道自己正在往前走、右轉、左轉或倒退。一般情況下,我們的知覺事實上是多個感官的融合,所以能有更為準確的運動姿態認知,那我們來看看單靠視覺,可能是怎麼達成基本的估計。

從輸入端開始,視網膜細胞感知光亮度變化,當亮度變亮送出ON訊號,變案則是OFF,沒有變化則不反應,並投射至LGNm(M細胞),其實和近年興起的DVS(dynamic vision sensor)運作模式是一樣的;緊接著,LGNm往V1的路上利用Reichardt-Hassenstein模型解析光流(optical flow);V1和MT在這裡的功用則可視為加強光流感知,加強視野中各區的光流對比;最有趣的部份是如何在MSTd(dorsal MST)形成最終的運動姿態認知,假定每一種移動方式都對應一種光流場,各種模式都有一個模板神經會對該種光流型態有最大偏好,藉此篩選出當下的運動狀態。

基於前述的模型,更新的研究報告提出如何將前景的移動物體從背景分離,事實上非常直觀,理想上我們將當下光流場減去自體運動產生的光流,就會留下獨立移動物體光流,進而能推估該物體速度等資訊。而後來還引進雙眼視覺的概念,因兩眼視差,我們能推測物體的相對距離,輔助我們辨認不同遠近的移動物體。這一連串的模型描述人類感官的一項基本能力,然而必須要注意的是,該模型許多部份僅僅是為達成目的而設計,在生物上不一定有同樣的機制存在,反倒在工程上較容易實現。


撰文:姚皇宇


原始文獻:
Layton, O. W. & Niehorster, D. C. A model of how depth facilitates scene-relative object motion perception. PLOS Computational Biology 15, e1007397 (2019).
Layton, O. W. & Fajen, B. R. A Neural Model of MST and MT Explains Perceived Object Motion during Self-Motion. J. Neurosci. 36, 8093–8102 (2016).
Layton, O. W. & Fajen, B. R. Competitive Dynamics in MSTd: A Mechanism for Robust Heading Perception Based on Optic Flow. PLOS Computational Biology 12, e1004942 (2016).

留言