果蠅對於獎勵的預期和決策成正比
一直以來對於幾率事件的研究都停留在人類,靈長類以及小鼠上,而背後的腦神經連接回路一直未被探索表面,一直到這篇論文的發表。 該研究團隊利用果蠅的大腦已經被研究行之有年的優勢,讓果蠅在類似於T-maze的Y-maze之中訓練,當果蠅走到某個顔色時給與某個幾率的獎勵刺激,到另一個顔色則給與另一幾率的獎勵,觀測果蠅是否會隨著時間往某個顔色前進。實驗發現果蠅做出的選擇與該顔色的獎勵幾率成正比(圖2,左)。實驗團隊據此結果給與模型解釋(圖2,右)。 圖1,實驗設計。果蠅已進入黃色或綠色區域后,馬上給與刺激(獎勵區域),并且進行到下一個Trial,Y-maze重置。有圖為果蠅隨著時間會逐漸選擇有獎勵的區域。 圖2,左側的圖顯示果蠅的決策和該區域的獎勵幾率成正比。右側為該行爲的model,區域的獎勵區域直接和果蠅腦内的連接(weight)成正比,也因此輸出的結果就是腦内連接的weight的幾率。 從實驗結果可以觀測到,果蠅做出的決策和人類還是有一定區別。人類在瞭解到某個區域的獎勵幾率更高的時候會傾向往幾率最高的區域移動,但果蠅的選擇則是和幾率成正比。這樣的差異可能來自與生存上不同的決策模型對於不同的物種有利。 撰文:陳怡亨 原始論文: Rajagopalan, A. E., Darshan, R., Hibbard, K. L., Fitzgerald, J. E., & Turner, G. C. (2023). Reward expectations direct learning and drive operant matching in Drosophila. Proceedings of the National Academy of Sciences, 120 (39), e2221415120. https://doi.org/10.1073/pnas.2221415120