AI除了能看懂圖片、聽懂人話,現在也能分辨複雜網路?

AI應用常見於自駕車、人臉辨識、生醫資訊、語音助理等等,這些領域包含電腦視覺以及自然語言分析,隨著人工智慧的發展至圖論(Graph theory)領域,就有了graph neural network 簡稱 GNN,試圖解決複雜網路問題,複雜網路構建自節點(node)和連結(edge),GNN能夠分析複雜網路中每一個節點之間的關聯性,除了能將node分群之外也能對整個graph進行分類,這裡就提出一個實用的案例: GNN的蛋白質對接模型評估。

這篇論文主要是希望開發出一個模型能夠辨識蛋白質對接的可能性(預測對接是否能成功),然而蛋白質對接(Docking)是分子模擬的方法之一,蛋白質對接的重要性在於藥物設計、致病機轉都有廣泛的應用。

該團隊透過GNN-DOVE提取蛋白質的表面區域結構,並轉換為圖形(graph),主要將蛋白質表面的原子作為節點(node) 以及原子的化學性質作為節點的特徵(Feature) 和原子間的距離作為連結(edge)的特徵。
圖1. 兩個蛋白質的接觸面被提取出來並轉換成graph的過程,透過上方流程減去下方流程的連結,藍色的連結就是兩個蛋白質介面之間的共價鍵,將共價鍵的連結轉變成graph以便後續模型訓練。

圖2. 在Dockground數據集,不同方法的結果圖。

最後我們可以從此案例了解GNN在蛋白質介面的分析非常優秀,並且GNN可以節省大量運算資源,主要優勢在於僅需要節點和其特徵以及節點之間的連結,有別於電腦視覺需要完整的圖片資訊或3D的立體影像資訊,動輒都需要數十萬像素以上的資訊,GNN用於商業上的案例也非常多,較有名的包含Amazon 以及 Netflix 用戶愛好分類,不僅是基礎科學研究,AI也用於應用科學之中,也許未來AI就成為如同語言一樣的必備工具。


撰文:許楷翊


參考文獻:Wang, X., Flannery, S. T., & Kihara, D. (2021). Protein docking model evaluation by graph neural networks. Frontiers in Molecular Biosciences, 402.

留言