人手不足? 數據不夠? 那就基於物理去生成擬真數據訓練AI吧!

隨著光學顯微鏡的進步,科學家已經可以拍攝到活體的細胞螢光影像,根據活體細胞的影像可以幫助我們了解細胞的生長過程,也能反映即時的實驗結果 e.g. 觀察小鼠心肌細胞缺氧後的粒線體和囊泡的變化。

但隨著資訊的增加,過往都是透過人工去標記、分割細胞胞器的邊界,這個過程非常費時又需要仰賴專家的協助,往往導致研究進度緩慢,於是就有研究團隊提出基於物理的機械學習對活體細胞進行胞器分割。一共有兩個階段,第一階段是透過物理的模擬去生成擬真粒線體與囊泡,並同時可以得到基準(Ground truth)。第二階段是透過語意分割方法: U-Net去進行胞器的分割。
圖1. 基於物理模擬的數據生成步驟。1. 計算胞器結構的3D幾何形狀。2. 產生螢光分子的位置以及光動力學。3&4. 顯微鏡的3D點擴散功能,用於生成合成影像。5.使用顯微鏡的噪聲模型計算逼真的噪聲圖像。6. 從無噪聲圖像去分割出遮罩(Ground truth)

圖2. 原始影像與人工標記的Ground truth與基於物理模擬的Ground truth。

圖3. 小鼠心肌細胞缺氧實驗和人類癌症細胞分割結果。1. 左圖紅色的原點是囊泡,綠色線是粒線體,左下圖是缺氧一小時的細胞,粒線體分布和囊泡數量明顯的變化。2. 右邊是人類癌症細胞,疏密的區域都能分割出粒線體。

AI的應用需要大量的基準數據,這個研究主要貢獻在於透過物理模擬噪聲圖像,足以讓U-Net模型能成功學習到各種螢光影像中胞器的邊界特徵。


撰文:許楷翊


參考文獻:
Sekh, A. A., Opstad, I. S., Godtliebsen, G., Birgisdottir, Å. B., Ahluwalia, B. S., Agarwal, K., & Prasad, D. K. (2021). Physics-based machine learning for subcellular segmentation in living cells. Nature Machine Intelligence, 3(12), 1071-1080.

留言