基於行為樹的多無人戰車協同決策方法

為了解決多無人戰鬥車輛系統在複雜環境和多任務條件下的有效決策困難,本文提出了一種基於行為樹的協同決策方法。該方法通過分析現有的無人車輛行為決策系統,建立了一套行為樹模型,以實現對多無人戰鬥車輛的合作決策。研究中詳細描述行為樹算法的建模過程,分析行為樹模型的結構和特點,並通過實際應用在Robomaster AI機器人上的案例來驗證了該方法的有效性。

本文首先介紹了行為決策的概念和重要性。行為決策是指對整體進行評估並生成決策資訊,支援於當前環境收集的資料、自身和隊友的狀態、敵人的位置和狀態,以便根據當前狀態提供合理的行為策略,並控制無人車系統完成所需任務。目前,無人車輛行為決策主要分為兩類:基於學習演算法的決策系統和基於規則的決策系統。基於學習演算法的行為決策是指通過對環境樣本的自主學習,利用不同的學習方法和網路結構直接匹配行為並輸出決策行為,代表性的機器學習方法有深度學習相關方法和決策樹。而基於規則的行為決策是指根據先驗經驗,將無人車輛的行為劃分為不同的狀態,最終根據規則邏輯確定車輛的行為。

接著,本文詳細介紹了行為樹算法的概念和特點。行為樹是從有限狀態機(FSM)改進而來的,它採用了一種由邊和節點組成的倒置樹結構,通過模組化狀態和任務來實現有限決策行為的切換。如圖一。行為樹的節點表示一個動作,當系統規模增加時,可以通過添加單獨的行為節點或行為子樹來輕鬆擴展行為樹。行為樹通過邊緣和節點之間的連接來構建,節點完成內部邏輯判斷和最終行為輸出。行為樹的節點包括選擇節點、順序節點、修飾器節點、並行節點等,通過不同節點的組合完成對子節點的組合操作,如循序執行、選擇執行、並存執行等。條件節點負責行為樹內部的邏輯判斷,返回true或false,動作節點實現具體的行為,如移動到目標點、執行射擊等。系統每幀遍歷行為樹,從頂部到底部、從左到右依次檢測每個節點是否被啟動,直到到達當前啟動節點以刷新行為樹。
圖一、典型行為樹模型

再者,本文通過實際的比賽場景和數據分析來驗證了行為樹模型的有效性。如圖二。實驗以Robomaster AI機器人為基礎,通過兩個無人車輛組成一個團隊,採用對抗方式來驗證多無人戰鬥車輛行為決策系統的有效性。
圖二、實驗機器人與場地

A. 行為樹構建
行為樹包括供給和進攻兩種主要狀態,同時為了防止多個無人車輛的決策內容不必要的重複,無人車輛可以通過系統內部共用車輛資訊來即時獲取隊友和任務狀態的決策資訊,從而實現協作決策方法。如圖三。行為樹主要由脫困、補給和進攻組成,通過行為樹建模實現對對抗環境中無人車輛系統的自主行為決策。
圖三、實驗使用的行為樹

B. 黑板模組
為了將狀態和任務模組化,從而使決策邏輯和資料分離,本文引入了黑板系統,通過收集定位、感知等模組以及其他無人車輛傳入的資訊,並對資料進行綜合處理,為行為樹提供狀態資訊,以完成行為決策的輸出。如圖四。行為樹本身無法修改黑板內部的資料,只能讀取黑板內部的資料,完成當前狀態判斷,並輸出正確的行為。
圖四、行為決策模組(行為樹+黑板模組)

最後,通過本文提出的基於行為樹的多無人戰鬥車輛協作行為決策方法,在多工環境下,能夠有效生成適當的行為決策資訊。還介紹了黑板系統,該系統將狀態和資料分離,為準確的狀態確定提供了重要的方法保證。本文通過賽事場景的實驗和典型場景的分析驗證了行為樹演算法的有效性。實驗結果表明,如圖五、圖六,該方法在多個無人車輛共同執行多個任務時具有良好的即時性和準確性。
圖五、實驗比賽紀錄

圖六、即時決策輸出



撰文:陳祖喬


原始論文:S. Feng, J. Xi, C. Gong, J. Gong, S. Hu and Y. Ma, "A Collaborative Decision Making Approach for Multi-Unmanned Combat Vehicles based on the Behaviour Tree," 2020 3rd International Conference on Unmanned Systems (ICUS), Harbin, China, 2020, pp. 395-400, doi: 10.1109/ICUS50048.2020.9275007

留言