等變濾波器在視覺/慣性定位的應用

視覺-慣性里程計(visual-inertial odometry, 以下稱VIO)常常被應用在各種情境,像是VR/AR、手機、無人機等等;當我們只有一顆相機時,省電/硬體成本的同時也省去了多相機校正的麻煩。在近期,單目 VIO 以精度為優先的最佳化法,以及速度為優先的卡爾曼濾波為大宗,而等變濾波器則成為了另一選項。澳洲國立大學最近開源了一項專案及相關論文(Goor and Mahony 2022);文中提出了一個新的李群 VI-SLAM,其對稱性質使它對自身、對應的流形和輸出空間的作用是等價的。透過良好的定義單位元素、逆元素、群乘法及群作用,一個用於 VI-SLAM的等變濾波器就能被設計出來。(註1, 2)

VI-SLAM中,除了描述 IMU 動態系統的擴展特殊歐式群 SE_2(3),此篇論文也提出了以延展正交群 SOT(3)作為地標參數化的方法,並展示了包含正深度與逆深度等不同方法對精度造成的影響。逆深度在近十年因為其常態分布更符合現實中地標的深度分布而被廣泛應用,而 SOT(3)的線性化誤差複雜度雖與逆深度同為二次,它的等變近似可以使其誤差複雜度下降到三次項,換句話說,得到更高次項的近似。

與舊有的擴展卡爾曼濾波相比,等變濾波器除了同上段一般地獲得更高次項近似,運算時間也因為同精度下需處理的特徵點地標較少、需維護的狀態量只有一個,而能更快地運作。也因為其快速收斂地標深度的特性,在特徵點數量極少時(註3)仍能產出可靠的估計。

註釋:
1. 李群基本上就是一個用流形表達的概念,這個流形可以利用對稱變換,針對其自身做出一些行動。舉例來說,一個特殊正交群 SO(2)可以用來表示二維空間的旋轉,而它也可以用單位圓 S^1這個流形來表示。李群特別要求流形要是光滑可微的,而這很大程度減少我們為它們設計濾波器的難度。
2. 關於群論的對稱性質,可以參考3B1B的科普影片: https://youtu.be/mH0oCDa74tE
3. 經筆者測試最少只須同時兩個地標即可
4. EqVIO 的展示影片請參考論文作者的 YouTube 頻道:https://youtu.be/5y9vs0QASVY


撰文|葉宸甫


參考論文
Goor, Pieter van, and Robert Mahony. 2022. “EqVIO: An Equivariant Filter for Visual Inertial Odometry.” arXiv. https://doi.org/10.48550/arXiv.2205.01980.

留言