跳到主要內容

搜尋此網誌

神經妙算

神經資訊學與計算神經科學科普報導。本部落格由國立清華大學羅中泉老師實驗室提供。

Home

發表文章

精選

12/01/2025 07:30:00 上午

液體狀態機左右互打越練越強？(液體狀態機與強化式學習)

前言：大家好，今日要介紹的文章為 2025 由 Krenzer 與 Bogdan 等人，刊登於 Frontiers 期刊的文章【Reinforced liquid state machines—new training strategies for spiking neural networks based on reinforcements】，主要是在探討回饋機制對於類神經網路的影響，作者提出了一個有趣的框架把 Liquid State Machine（液體狀態機）搭配 Reinforcement Learning（強化式學習）觀察在各種回饋情形下，RLSM（Reinforced liquid state machines）架構是否可以優於無監督式學習的 LSM？我們開門見山先講結論，在把語音數字（0–9，英/德文）轉成脈衝事件的聽覺資料集 Spiking Heidelberg Digits（SHD）上是可以優於無監督式學習的 LSM！接下來就來一起看看強化式的液體狀態機是如何處理這些任務的吧！我會先簡單講解一些強化式學習的概念讓大家比較好帶入與了解，液體狀態機的部分可以去觀看我上一篇的《脈衝神經網路可以自己分類?--液體狀態機與無監督式學習》的 LSM 背景處。 ----------------------------------------------------------------------------------------------- 強化式學習：提到強化式學習（RL）時，我們可以用一種簡單的方式理解，相信大家都有玩電腦遊戲的經驗吧，我們把強化學習（RL）想成「玩遊戲的練功系統」：電腦（代理人）在環境裡嘗試各種動作，拿到分數（回饋），慢慢摸索出能「長期拿高分」的做法（策略）。它不告訴你正解，只告訴你做得「好不好」，所以特別適合需要連串決策、結果常延遲的問題，例如機器人控制、推薦系統或自動駕駛，架構觀念如（圖一：RL基礎架構源）。然而這種看似沒有固定答案的學習模式為什麼會被大家使用呢？原因很好理解，其實是因為現實世界很少有完整標籤資料，但仍可以觀察到行為後果；就如同研究神經科學時，透過行為模式去回推背後的生理機制。RL 同樣在互動中一邊探索一邊學，學到做什麼會更好，也強調模式選擇後的長期報酬，避免只為眼前利益而做出短視決策。 RL 發...

閱讀完整內容

最新文章

11/27/2025 07:30:00 上午

從機器人到大腦：為何大腦的 GPS 也使用對稱性？

11/24/2025 07:30:00 上午

高效調整：讓人工智慧學會自己調參數

11/20/2025 07:30:00 上午

當突觸學會等待：海馬的秒級學習與信用分配之謎

11/17/2025 07:30:00 上午

行為序列架構分析教師學生行為

11/13/2025 07:30:00 上午

Neuromorphic to me

11/10/2025 07:30:00 上午

機器人要開始學會如何感覺了：用液態狀態機，讓 BAXTER 拿筆畫出漂亮的方形

11/06/2025 07:30:00 上午

樂於「彎來彎去」的祕密：昆蟲大腦節奏如何啟發智慧機器人 ——從蟲子的「Z字形探索」到自適應移動大未來

11/03/2025 07:30:00 上午

用深度學習「矯正」顯微鏡像差：AI 讓科學家看得更清楚

10/30/2025 07:30:00 上午

蒼蠅的倒掛絕技：如何在天花板上完美著陸

10/27/2025 07:30:00 上午

重力引導的大腦指南針：老鼠腦中的三維導航祕密

較舊的文章

技術提供：Blogger

封存

2025 91

2024 99
- 12月 7
- 11月 8
- 10月 8
- 9月 9
- 8月 9
- 7月 9
- 6月 8
- 5月 9
- 4月 9
- 3月 8
- 2月 6
- 1月 9
2023 100
- 12月 8
- 11月 9
- 10月 8
- 9月 8
- 8月 9
- 7月 9
- 6月 9
- 5月 9
- 4月 8
- 3月 9
- 2月 8
- 1月 6
2022 101
- 12月 9
- 11月 8
- 10月 9
- 9月 9
- 8月 9
- 7月 7
- 6月 9
- 5月 9
- 4月 8
- 3月 9
- 2月 7
- 1月 8
2021 96
- 12月 9
- 11月 9
- 10月 8
- 9月 8
- 8月 9
- 7月 9
- 6月 6
- 5月 9
- 4月 9
- 3月 9
- 2月 4
- 1月 7
2020 94
- 12月 9
- 11月 9
- 10月 8
- 9月 7
- 8月 8
- 7月 9
- 6月 7
- 5月 8
- 4月 7
- 3月 9
- 2月 8
- 1月 5
2019 97
- 12月 9
- 11月 8
- 10月 9
- 9月 9
- 8月 9
- 7月 7
- 6月 6
- 5月 9
- 4月 9
- 3月 8
- 2月 6
- 1月 8
2018 98
- 12月 9
- 11月 7
- 10月 9
- 9月 8
- 8月 7
- 7月 9
- 6月 8
- 5月 8
- 4月 12
- 3月 6
- 2月 6
- 1月 9
2017 92
- 12月 8
- 11月 8
- 10月 10
- 9月 16
- 8月 7
- 7月 13
- 6月 13
- 5月 16
- 4月 1

顯示更多顯示較少

標籤

大腦網路1
生理時鐘1
記憶1
新知速報17
導航1
論文回顧5
機器學習1
觀點文章2
Bifurcation2
conflict learning1

Game theory1
grid cell1
Hebbian learning1
Izhikevich8

顯示更多顯示較少