生物啟發的光流估算:昆蟲視覺的啟示
昆蟲視覺系統在導航中扮演了重要的角色。儘管昆蟲的視覺系統結構簡單,它們卻能在複雜環境中靈活穿梭,並準確避開障礙物。相比之下,人類與動物需要的複雜運算和高對比度環境,昆蟲的視覺系統能適應不同的環境對比度,並且能在高速度下做出反應。這篇文章介紹了一項基於昆蟲視覺的特性,開發出一種「生物啟發的光流估算模型」的研究,這一模型的亮點在於它可以在低對比度環境下準確估算物體的碰撞時間,具有應用於無人機導航和機器人避障的潛在價值。
昆蟲視覺的獨特性在於,它們的視覺系統可以將「光流」(optic flow)處理分為兩個主要模式:快速視線轉移(saccades)和穩定的平移運動。在快速視線轉移中,昆蟲的視覺短暫聚焦以識別周圍的物體或方向,這一模式使昆蟲能夠快速分離旋轉運動。而在視線平穩的狀態下,昆蟲的視覺則專注於識別物體的相對運動,這樣能夠估算物體與昆蟲之間的碰撞時間,從而做出避障反應。
然而,將昆蟲視覺系統中這些功能應用於人工智能或自動化系統中並不容易。當前的光流估算技術,如無人機和自動駕駛車輛,通常依賴高對比度的視覺環境才能達到理想的效果,因此在變化較大的光照或低對比度環境中易出現誤判或效能下降。這類技術難以適應日常生活中的複雜環境,亟需能夠在不同對比度下正常運作的解決方案。
本研究中的研究人員以昆蟲視覺為靈感,開發了一種新型的光流估算模型,並透過一系列硬體與演算法來模擬昆蟲的視覺特徵。研究團隊使用了一台高解析度相機,配備全向鏡頭(360度視角),來捕捉環境中的各種影像。實驗環境採用受控光源,並搭配不同顏色和紋理的背景,用以測試模型在不同對比度下的適應能力(圖一)。這樣的設置目的在於模擬昆蟲的視覺情境,從而更好地測試模型的表現。
圖一、實驗設置 (a) 俯視圖顯示相機軌道平行於牆壁,並從左至右移動。相機光學中心與目標之間的距離標記為 L,目標位置沿 x 軸約為 800 毫米。每個像素的視野(FOV)和空間取樣寬度標記為S (c) 側視圖顯示相機光學中心距地面的高度 H,鏡頭的正負 FOV 分別為 +38° 和 -15°。 |
該模型在架構上模擬了昆蟲視覺系統中的多層結構,包括五個主要部分(圖二):
1. 光感受器(PR):模擬光轉換為電信號的過程,主要負責處理視覺信息中的光強變化,達到類似於昆蟲視覺中的動態光亮度調整。
2. 單極細胞(LMC):濾除冗餘信息,強調物體邊緣,幫助增強物體輪廓的清晰度。
3. 基本運動檢測器(EMD):計算運動能量,利用高通濾波器來提升檢測精度,專注於檢測視覺場景中的平移運動。
4. 中葉-大葉介神經元(MLI):此層進行動態對比度適應,尤其是在低對比度的環境下,對視覺信息進行增強和調整,從而克服了對比度依賴。
5. 板狀細胞(LPTC):最後的整合層,用於輸出相對運動的估計結果,幫助計算物體的碰撞時間。
圖二、算法模型。包括光感受器(PR)、單極細胞(LMC)、HR基本運動檢測器(EMD)、中葉-大葉介神經元(MLI),以及板狀細胞(LPTC)在 PR、LMC 和 EMD 階段中,有 4 個不同的點可將強度信息傳遞至 MLI 模型,用於對比度的動態能量標準化。 |
研究結果顯示,所開發的光流估算模型在對比度獨立性方面表現出色。與先前依賴高對比度的模型相比,該模型在低對比度環境下也能提供準確的運動估算,達到約17倍的性能提升。這一成果主要得益於中葉-大葉介神經元(MLI)中的對比度適應層,該層使模型能夠動態調整,克服視覺信息中對比度的變化問題。實驗還顯示,即便在不同速度、距離以及背景對比度條件下,模型的估算結果依然保持穩定(圖三)。
圖三、不同背景下的算法響應比較。此圖展示了模型在目標距離200毫米、速度127.98毫米/秒,以及三種不同背景(黑色、橙色和白色)下的個別響應。此圖顯示了每個可分離模型元素(如圖二所示)後的算法響應。最終模型輸出(g)顯示出對比度的獨立性,亦即無論背景顏色為何,響應都保持一致。 |
透過與較簡單的模型進行對比(圖四),研究人員證明了這種多層結構的生物啟發模型在估算運動時的優越性。該模型能夠通過類似昆蟲視覺的視覺流程,有效地處理動態視覺信息,使其在低對比度的情境下也能表現出色。研究人員量化了這一性能,並通過計算得出該模型的各個組件對於提高穩定性和準確性的貢獻。
這項研究展示了生物啟發技術在現代視覺系統中的應用潛力。該模型的對比度獨立性代表著它可以在不同光照和對比度環境中應用於自動駕駛、無人機導航和機器人避障等領域,這些技術都需要在複雜的環境中穩定運行。尤其是在低光或高動態的場景下,此類演算法可提供更高的可靠性。
本研究不僅對模仿昆蟲視覺系統提出了新的方法,也為計算機視覺和機器人技術的發展提供了新的方向。透過進一步優化此模型,未來或許能將昆蟲視覺系統的適應性與穩定性更好地移植到人工智能系統中,使自動化技術更具實用性和應用價值。
撰文:余雪淩
原始論文:Skelton, P. S., Finn, A., & Brinkworth, R. S. (2022). Contrast independent biologically inspired translational optic flow estimation. Biological Cybernetics, 116(5), 635-660.
留言
張貼留言