使用機器學習,達成障礙物檢測與深度估計合體的避障方式

現有的許多無人機/車的避障方式,需要使用深度估計相關的設備(如LiDAR, 立體相機等),來建構稠密的三維地圖,才能完成任務,而Michele Mancini等人於2018年發表的系統,使用機器學習的方式,使用單目RGB相機獲得的影像。產生出二維圖像的障礙物檢測以及深度估計,它們將這個方式稱為J-MOD(圖一)。
圖一

並藉由這兩項資訊一起產生出障礙物檢測框內的平均深度,直接控制無人機/車,這樣的好處是在訓練神經網路時每個像素的損失函數變化更單純,更容易訓練出準確率高的避障系統,並且因為犧牲了一些深度解析度,所以獲得了更好的運算效能。

在後續的避障模擬測試中,他們使用虛幻引擎建構了一個森林場景,並且讓無人機在其中執行避障任務,它們從神經網路獲取障礙物框內的深度估計值,動態建構出當下的octomap(一種建構三維地圖的方式,由許多類似minecraft的方塊組成),並使用RRT-Connect算法規畫路徑,測試過程中以1m/s的速度移動,並設定最大高度為5m,並且為每個任務測試15次,如果無人機墜毀、卡住或是沒有在5分鐘內完成任務則判定為任務失敗。(圖二)
圖二

至於最後的分析結果我個人認為沒有太大的參考性,首先他為了擬補RRT-connect path planning的錯誤,他們將每個障礙物邊緣額外增加了空氣牆,使軌跡運算不會太靠近障礙物,但即使是這樣,他們的成功率仍然只有73.3%,並且表示失敗的主要原因大部分都是因為RRT-connect這個算法的問題。(圖三)
圖三


撰文:唐朝洋


Reference:
M. Mancini, G. Costante, P. Valigi and T. A. Ciarfuglia, "J-MOD2: Joint Monocular Obstacle Detection and Depth Estimation," in IEEE Robotics and Automation Letters, vol. 3, no. 3, pp. 1490-1497, July 2018, doi: 10.1109/LRA.2018.2800083.

留言