反應結果控制了預期對感知決策的影響

知覺決策是基於感官信息,但也可能受最近經驗建立的期望影響。可以根據先前決策的結果靈活調整期望的影響嗎?在這裡,老鼠執行聽覺任務,其中重複先前刺激類別的概率在試驗組中有所不同。所有老鼠都通過利用序列相關性:使用序列重複概率的內部估計來重複或交替其先前反應的趨勢。出人意料的是,在進行錯誤試驗後,這種偏見為零。但是,內部估計不會重置,並且在下一次正確響應後會再次生效。此行為由生成模型捕獲,因此,獎勵驅動的調製信號可以控制環境的潛在模型對當前決策的影響。這些結果表明,根據先前的結果,老鼠可以靈活地調節期望值如何影響其決策。

規範理論描述了如何事先期望和曖昧刺激的證據應以最大限度地提高分類性能相結合。在感官信息的統計信息隨時間變化的動態環境中,受試者必須通過累積過去的刺激,動作和結果不斷更新其內部模型。基於在每個試驗中發生的動作與現有的更新典型地引入順序的作用,這是系統的歷史依賴選擇的偏差反映了試驗對試驗變化的在期望的影響。但是,在某些情況下,受試者似乎能夠快速靈活地調整先前期望的影響,以推動他們的選擇。這樣的例子之一是在(1)根據當前的環境統計模型利用選擇更有可能產生回報的選擇之間進行切換,以及(2)在考慮內部模型的情況下探索並非旨在最大化回報的選擇,但是,以減少環境的不確定性,並最終完善當前的模型。特別是當任務設計增強了隨機探索能力時,老鼠能夠以無期望的模式進行操作,其中的選擇不取決於先前的歷史。在其他任務中,當呈現新信息時,內部先驗的更新不是以連續的方式進行的,而是當受試者感覺到環境存在變化點時,他們會突然間斷地更新其內部估計。最近的研究表明,在不存在的反饋,對當前選擇的期望偏壓的大小是一個低可信度響應之後較小。儘管有這些發現,仍然缺乏一個概念框架可以解釋預期的形成方式以及哪些因素會不時地調節預期的使用。

因此,開發一個統一的模型,該模型在逐個試驗的基礎上共同描述期望建立的動力學及其調節變量。為訓練大鼠使用具有序列相關性的刺激序列執行感知辨別任務。行為分析可以梳理出不同類型的歷史偏見。尤其是,大鼠在先前的選擇過渡(定義為兩個連續選擇的重複或交替)上積累了證據,以便預測下一個獎勵的反應。至關重要的是,這種基於期望的偏差會在發生錯誤後消失,這反映出已快速切換到無期望的分類模式。但是,此開關並不意味著 重置累積的期望值,一旦動物獲得新的獎勵,它就會恢復對行為的影響。跨動物的這種普遍存在的行為很容易被非線性動力學模型捕獲,其中先前的結果充當了過去轉變對未來選擇的影響的大門。


撰寫人:王任權


原始論文
Response outcomes gate the impact of expectations on perceptual decisions
Ainhoa Hermoso-Mendizabal, Alexandre Hyafil, Pavel E. Rueda-Orozco, Santiago Jaramillo, David Robbe & Jaime de la Rocha, Nature Communications volume 11, 26 February 2020
https://www.nature.com/articles/s41467-020-14824-w#author-information

留言