未來式:與人工智慧並肩解決難題

在過去一年中,大型語言模型(LLM)以其強大的理解和推理能力風靡全球,其解決問題的能力已媲美各個領域的專家。今天要介紹一種創新的框架——Autogen,這是一個結合人類智慧、LLM及工具的多代理框架,旨在定制化解決複雜任務的工作流程。

什麼是 Autogen?
Autogen 是微軟推出的一個創新框架,它允許開發者創建和管理像 ChatGPT 和 GPT-4 這樣的大型語言模型。想像一下,有一群智慧代理,它們就像是你的虛擬小助手,能夠透過相互對話來幫助你解決各種問題。


Autogen 的神奇之處
1. 多元對話: Autogen 內的代理能夠是人工智慧、人類,甚至是工具。這些代理彼此對話,共同協作,解決複雜問題。
2. 人機協作: Autogen 特別之處在於它鼓勵人類與智慧代理共同合作,使雙方能夠互相學習,共同進步。
3. 教育應用: 想像在學習中遇到障礙時,能夠請教一位永遠耐心、博學多識的人工智慧代理,這將極大地激發學習興趣和效率。
4. 未來職場: 在未來的工作環境中,Autogen 驅動的智慧代理將協助處理數據分析、編程問題,甚至日常行政工作。

我們可以查看圖1 的六個應用場景,Autogen凸顯了其靈活性和能力:
1. 數學問題解答 (A1):這個場景展示了一個學生代理和助理代理相互協作,以解決數學問題。當助理需要額外專家的説明時,它可以請求專家代理介入。
2. 檢索增強型聊天 (A2):在這個例子中,使用者代理和助理代理可以通過檢索資訊來增強對話內容,説明提供更豐富和準確的回答。
3. ALF聊天 (A3):ALF世界執行者和地面代理參與對話,以完成特定任務,如虛擬環境中的行動。
4. 多代理程式設計 (A4):指揮官、寫手和保障代理共同工作,進行代碼編寫和安全檢查,以確保程式設計任務順利完成。
5. 動態群聊 (A5):在動態群聊中,一個管理代理協調其他代理的交流,可以發送廣播消息或者進行單獨對話,以實現群體合作。
6. 對話式國際象棋 (A6):玩家A和玩家B可以是人類或者人工智慧,他們通過對話形式來表達國際象棋的移動,使遊戲更加互動和有趣。
圖1: 六個不同的應用場景

更深入分析Autogen在解決數學問題和ChatGPT4的比較(圖2)
在這張圖中,我們可以看到Autogen在數學問題解決方面的性能與其他幾種方法相比較的結果。左圖顯示了Autogen與其他幾種人工智慧系統在解決MATH資料集問題上的成功率。Autogen顯示出較高的成功率,尤其是在解決120個五級難度問題的子集上,它的成功率達到了52.5%,明顯高於ChatGPT加代碼、ChatGPT加外掛程式和單獨的GPT-4。
右側的表格提供了這些系統在兩個具體數學問題上的定性評估。表中列出了每個系統解決問題的正確率以及失敗的原因。例如,在簡化根號分數問題上,Autogen取得了3/3的完美正確率,而其他方法表現不佳,失敗原因多種多樣,包括返回錯誤的十進位結果,給出三個不同的錯誤答案,或者計算錯誤。
圖2: Autogen與其他幾種人工智慧系統比較圖表

每一個應用都反映了Autogen在處理資訊、解決問題和促進互動方面的潛力。無論是在學術學習、程式設計開發還是娛樂活動中,Autogen通過這些代理的協作能力,為各種情境提供支援和增強。 

我認為Autogen對於開發人員最大的益處是有高度靈活性,可以簡易地構建多個代理,並且可以輕鬆插入多種工具能力(聯網、RAG(Retrieval Augmented Generation)、API) ,開發人員客製化特定任務的工作流程,進而提高工作效率、解決複雜的問題。

想像一下,有一天你能和人工智慧代理一起完成回家作業,或者在科學實驗中得到它們的幫助,這將是多麼酷的學習體驗!而在職業發展方面,掌握這些技術將使你在未來的工作市場中更具競爭力。

P.S.特別感謝 #ChatGPT 潤飾此篇文章。 🤖


撰文:許楷翊


參考文獻:
Wu, Qingyun, et al. "Autogen: Enabling next-gen llm applications via multi-agent conversation framework." arXiv preprint arXiv:2308.08155 (2023).

留言