階級式學習 (Hierarchical Learning) 產生的結果
人類從古代文明開始至今,社會的運作始終存在著階級分工的制度,以達到效益加成的結果。此外階級式運作也在神經生理學上被發現,用於執行生物的認知和決策,並不是單純社會發展出的制度。階級制度分工最簡單的例子是兩層級,即上級對任務進行規劃及訂下邊界條件後,下屬對被規劃的範圍執行細節的分析。階級制度雖然可以讓效益加成,但也產生誤差回饋的模糊性,當產生的結果有誤或非預期結果,讓結果出錯的原因來自上級的規劃錯誤,或是下屬執行錯誤,又或是來自外在的噪音干擾,這在階級制度中很難被追朔。
這篇文章以最簡單的兩層級對人類進行實驗,並且建立了電腦模型『HL學習模型』來模擬這樣的階級式學習效果。他們把 44 人以 2 人一組分成 22 組,其中一人擔當上級決策者 (H),另一人當下級執行者 (L),H 會被給予 3 個隨機 100 以內的數字 (x),並且選擇 3 個固定權重 (w) 中的兩個對 L 公開,而 L 必須猜測五次這些數字經過加權的總和 (y),即 y_i = sum(w_j * x_ji)。猜測結束後 H 會收到平均誤差訊息, L 會收到每回合的誤差訊息,如此重複實驗。至於電腦模型,他們對 H 使用了非監督式學習 (unsupervised learning),對 L 使用了監督式學習 (supervised learning) 進行模擬。
實驗結果顯示,經過很多回合的測驗之後階級式學習效果匯聚成兩種形態,一種學習成功讓誤差持續下降,另一種學習則陷入僵局,使得誤差持續保持在一定程度。他們分析學習成功的往往 H 在找到一個最佳規劃後,即權重選擇上找到最好讓 L 好猜測的規劃,L 回饋的平均誤差隨即下降,而陷入僵局的學習是因為 H 無法偵測到一個恰當的權重選擇,經常變換規劃,導致 L 沒辦法進行精確的判斷,所以回饋的平均誤差持續維持在一定程度。另外,他們的實驗結果也發現電腦模擬的數據和實驗數據是符合的,也就是說二層階級式學習假設的模型中 H 是使用非監督式學習,L 是使用監督式學習。
結論上看這樣的階級制度,學習結果的效益主要是先決定於 H 的學習經驗後,才依據 L 的回饋來進行改善。H 的學習行為大致可分成兩種,一是允許下級的緩慢學習效益,在基層執行上可以不斷嘗試,二是把共同二層學習的方式轉換成基本的統計計算,就是執行每個可能的規劃,並從中獲得最佳的選擇。總結來說對於二層階級的簡單模型來說,會出現兩種固定的學習模式,但這樣的結論是否能實際應用在多層階級的運作上,或是在實際社會組織運作上的真實性與可行性還有待研究,而且多少層的階級是可以最有效地達到產出加成的效果也還有待探討。但可以確定的一點是,要讓下級可以更精確更有效的進行基層分析,上級必須賦予他們一個穩定的環境,也就是穩定的規劃和指令,不斷變換的指令只會造成下級的混亂和不精確。
撰稿:薛又齊
原文:Hierarchical decision-making produces persistent differences in learning performance.
Thorbjørn Knudsen, Davide Marchiori & Massimo Warglien. Scientific Reports volume 8, Article number: 15782 (2018).
原文鏈接:https://www.nature.com/articles/s41598-018-34128-w
這篇文章以最簡單的兩層級對人類進行實驗,並且建立了電腦模型『HL學習模型』來模擬這樣的階級式學習效果。他們把 44 人以 2 人一組分成 22 組,其中一人擔當上級決策者 (H),另一人當下級執行者 (L),H 會被給予 3 個隨機 100 以內的數字 (x),並且選擇 3 個固定權重 (w) 中的兩個對 L 公開,而 L 必須猜測五次這些數字經過加權的總和 (y),即 y_i = sum(w_j * x_ji)。猜測結束後 H 會收到平均誤差訊息, L 會收到每回合的誤差訊息,如此重複實驗。至於電腦模型,他們對 H 使用了非監督式學習 (unsupervised learning),對 L 使用了監督式學習 (supervised learning) 進行模擬。
實驗結果顯示,經過很多回合的測驗之後階級式學習效果匯聚成兩種形態,一種學習成功讓誤差持續下降,另一種學習則陷入僵局,使得誤差持續保持在一定程度。他們分析學習成功的往往 H 在找到一個最佳規劃後,即權重選擇上找到最好讓 L 好猜測的規劃,L 回饋的平均誤差隨即下降,而陷入僵局的學習是因為 H 無法偵測到一個恰當的權重選擇,經常變換規劃,導致 L 沒辦法進行精確的判斷,所以回饋的平均誤差持續維持在一定程度。另外,他們的實驗結果也發現電腦模擬的數據和實驗數據是符合的,也就是說二層階級式學習假設的模型中 H 是使用非監督式學習,L 是使用監督式學習。
結論上看這樣的階級制度,學習結果的效益主要是先決定於 H 的學習經驗後,才依據 L 的回饋來進行改善。H 的學習行為大致可分成兩種,一是允許下級的緩慢學習效益,在基層執行上可以不斷嘗試,二是把共同二層學習的方式轉換成基本的統計計算,就是執行每個可能的規劃,並從中獲得最佳的選擇。總結來說對於二層階級的簡單模型來說,會出現兩種固定的學習模式,但這樣的結論是否能實際應用在多層階級的運作上,或是在實際社會組織運作上的真實性與可行性還有待研究,而且多少層的階級是可以最有效地達到產出加成的效果也還有待探討。但可以確定的一點是,要讓下級可以更精確更有效的進行基層分析,上級必須賦予他們一個穩定的環境,也就是穩定的規劃和指令,不斷變換的指令只會造成下級的混亂和不精確。
撰稿:薛又齊
原文:Hierarchical decision-making produces persistent differences in learning performance.
Thorbjørn Knudsen, Davide Marchiori & Massimo Warglien. Scientific Reports volume 8, Article number: 15782 (2018).
原文鏈接:https://www.nature.com/articles/s41598-018-34128-w
留言
張貼留言