應用UDA實現夜間影像的語意分割

3/04/2024 07:30:00 上午

應用UDA實現夜間影像的語意分割

語意分割(semantic segmentation)是一種將影像中所有像素進行分類的方法，分類後的結果通常會以色塊呈現。在影像辨識相關領域中，通常是取用日間(daytime)拍攝的影像進行訓練及測試。而在自駕車的應用上，夜間的影像辨識也一樣重要，只是夜間影像有一些訓練上的困難，如：亮度低、訓練資料較少等等，因此研究團隊應用「非監督式領域適應(unsupervised domain adaptation, UDA)」，降低日間領域和夜間領域之間的差異。這個方法叫做Domain Adaptation Network with Image Alignment (DANIA)，以三個領域(domain)作為訓練時的輸入資料：(1)日間標記、(2)日間未標記以及(3)夜間未標記，其中(2)和(3)是成對的影像，在同樣地點拍攝日夜不同的景象。藉由(2)建立起(1)和(3)之間的橋樑，學習日間影像的物體標記並應用到夜間影像中。也因此，訓練這三個領域時會進行權重共享(Fig. 1)。

在進入UDA之前，需進行亮度重新調整的前處理，以降低語意分割步驟對於亮度的敏感度。這個步驟稱為Image Relighting。透過亮度和圖片特性的運算後，產生性質相近的影像(Fig. 1 的Rs、Rtd、Rtn)。

在語意分割的步驟，使用三種方法：Deeplab-v2、RefineNet和PSPNet。在分類像素時，有些物件所佔的像素比例比較少，像是：燈桿、交通號誌，因此調整分類判斷的權重有助於提高語意分割的準確度；調整過的權重可以使小物件的權重提高(Fig. 1 的Ps、Ptd、Ptn；GT為ground truth)。最後的鑑別器(discriminator)用以判斷語意分割步驟預測出來的圖，「生成」來源是(1)，還是(2)或(3)。

Fig. 1 DANIA架構圖

Fig. 2呈現了DANIA和其他方法的測試結果之比較，最右邊的直欄是資料的ground truth，黑色表示沒有分類資訊。在DANIA方法中，物件邊界和植被的判斷表現比較佳。mIoU (mean of category-wise intersection-over-union) 是常用於評估語意分割表現的指標，數值越大、表現越好，在Fig. 3中呈現。除了夜間影像的訓練與測試，研究團隊也訓練及測試了一些天氣狀況的影像，例如：雪、霧、雨；視覺化的結果在Fig. 4。在Fig. 5的數值化結果可以發現，DANIA(RefineNet)在夜間(night)、雪(snow)以及四種情境混合(“all”)中表現最好，藉此可知，DANIA在不同情境之下，仍能有不錯的表現。

Fig. 2 視覺化結果：DANIA 以及一些方法的比較 (dataset: Dark Zurich)

Fig. 3 mIoU結果：DANIA 以及一些方法的比較 (dataset: Dark Zurich)

Fig. 4 視覺化結果：DANIA在夜間影像以及一些天氣狀況的判斷 (dataset: ACDC)

Fig. 5 mIoU結果：DANIA在夜間影像以及一些天氣狀況的判斷 (dataset: ACDC)

撰文：楊采綾

Reference:

X. Wu, Z. Wu, L. Ju and S. Wang, "A One-Stage Domain Adaptation Network With Image Alignment for Unsupervised Nighttime Semantic Segmentation," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 45, no. 1, pp. 58-72, 1 Jan. 2023, doi: 10.1109/TPAMI.2021.3138829.

https://ieeexplore.ieee.org/document/9664229

搜尋此網誌

神經妙算

應用UDA實現夜間影像的語意分割

留言

張貼留言

熱門文章

The Urgency Gating Model

DeepSORT : 一種簡單且有效的物體追蹤方法

透過蜜蜂避障學習自然界中的仿生導航策略