GNN能從分子結構更準確預測氣味感受

日常生活中,螢幕可以顯示出各種不同的畫面、耳機可以播放各種不同的聲音,但沒有單一的裝置或方法釋放各種不同的氣味,這反應相對於視覺與聽覺,我們對嗅覺感知的形成更陌生。事實上,人類的色彩視覺可以被CIE色彩空間解釋、聽覺則可以由傅立葉轉換將強度-時間轉換成強度-頻率,即我們耳蝸產生聽覺的方式。

科學家曾試著找出氣味分子結構與嗅覺的關係,然而首先面對的難關是許多化學結構相近的分子,人類聞起來的味道卻差異不小,聞起來相似的味道,氣味分子結構迥異,例如乙醛與丙酮為同分異構物,乙醛具刺激氣味,而丙酮略帶芳香味,之後科學家與嗅神經上的受體與化學結構的關係,但依然無法直接預測氣味分子產生的氣味感受,數量多的嗅覺受體,加上嗅覺受體的基因存在許多個體差異,每一種型態的嗅覺受體都需要詳細研究其反應型態,使得至今依然沒有一套模型可以很好的從分子結構預測氣味感受。

由賓夕法尼亞大學與Google主導、今年8月發表於Science的一篇研究,用graph neuron network (GNN)衍伸的message passing neural network (MPNN),訓練出比用少數人評估氣味感受更貼近人類氣味感受的模型,比人還貼近人是什麽意思?因為人類嗅覺受體間的個體差異比較大,相同物質給2個人聞經常會得到不同的氣味描述,但平均而言,人類群體對某物質的氣味描述還算一致。研究人員將每個氣味分子的原子當作圖(graph)的節點(vertex),原子間的鍵結當作圖的連結(edge),每個節點(原子)特徵包含原子序、價電子、鍵結方式(全單鍵、包含雙鍵等)等,連結(鍵結)特徵包含鍵角度、共振性、是否形成環,對照答案則來自Good Scents與GS-LF資料庫。人類對照則是尋找受試者回答各氣味是否具有某個形容詞的特色,每個氣味至少15人回答。模型預測與人類回答的結果會與資料庫答案進行相似度比對,結果顯示大多數氣味,模型預測的結果比人類回答更貼近資料庫的答案,但模型在比較複雜的氣味如麝香、乾草等表現沒有人類好。

傳統分析分子結構預測氣味感受的方法很難分辨結構相似,但氣味感受差異大的分子,研究人員為測試模型是否有這方面的缺點,讓3個分子形成一組,每組內有1個標準分子,其他1個與標準分子結構相似但氣味感受迥異,另1個與標準分子結構差別較大但氣味感受類似,模型的表現沒有如人類好(結構相似為不同氣味,結構有差為相似氣味),但比起過往的random forest模型表現好。

總體而言,模型能比少數測試者更精確的評估到人類群體對氣味的感受確實是氣味預測的里程碑,但其實模型預測的結果與資料庫的答案相關係數只有0.3左右,無法稱為精準預測,除此之外,用於測試的氣味濃度並沒有列入模型的考量範為,以及訓練氣味只包含有機化合物,沒有無機物等,都是這個模型需要進一步修正之處。


撰文:張誌元


參考資料:
Brian K. Lee et al. , A principal odor map unifies diverse tasks in olfactory perception. Science 381, 999-1006(2023). DOI:10.1126/science.ade4401

留言