生成式代理-人類行為的交互式模擬器

你有沒有看過影集《西部世界》?那是一部關於一個擁有高度智能的機器人的主題公園,遊客可以在裡面體驗各種冒險和角色扮演。這些機器人有自己的記憶、個性和目標,但也受到公園的規則和劇本的限制。你可能會覺得這只是一個虛構的故事,但其實,科學家們已經開始研究如何創造出類似且可信的人類行為代理人(Proxies)。

然而這些代理人其實並不是真正的機器人,而是一種生成式智能體(Generative Agents),它們可以用自然語言來模擬人類的行為和反思。它們每天都會做一些日常的事情,比如吃早餐、工作、交朋友等,並且記錄下自己的經歷和感受。它們也會互相觀察和交流,學習彼此的行為和想法。它們還會根據自己的記憶和反思,來規劃自己的未來行動。這些代理人的行為和反思都是由一個大型語言模型CHATGPT 3.5來生成的,這個模型可以根據不同的情境和目標,來產生合適的文本。

本篇研究中研究者創造了一個交互式沙盒環境,讓使用者可以與這些智能體進行對話、給予指示或者觀察他們的活動。使用者可以發現,這些智慧體不僅能夠回應使用者的輸入,還能夠主動發起話題、提出建議或者邀請使用者參加活動。使用者也可以看到,這些智能體之間會產生一些有趣的互動,比如舉辦派對、結交新朋友、相互競爭或者合作等。

這項研究展示了一種新穎的方式,利用大型語言模型來生成可信的人類行為。這不僅可以增強交互式應用的真實感和趣味性,也可以提供一個新的視角來探索人類社會的規律和現象。

而在現實應用方面,於遊戲端可以產生更真實的NPC,更令人享受的模擬世界,例如:遊戲版《西部世界》。本篇文章所介紹的AI NPC,對社會科學家來說則是可以模擬不同的社會情境和變數,並觀察代理人的行為和結果。你可以用它們來探索選舉、傳播、合作等社會現象。更甚至這項功能可以更拓展至教育或娛樂的平台,讓你與代理人進行各種角色扮演的對話和互動。你可以用它們來模擬面試、約會、談判等情境,並得到反饋和建議。對於天馬行空的遊戲總監或是科學研究家,你甚至能創造一個新的種族新的社會,全新的價值觀的社會體來觀察與呈現。
圖(一) Smallville沙盒世界,其中每個區域都被標注好了,擁有著咖啡館、酒吧、公園、學校、宿舍、房屋和商店。它還詳細定義了使這些空間發揮作用的子區域和物體,例如房屋中有廚房、廚房中還有爐灶。

圖(二) 通過追蹤一天內 John Lin 的系統輸出,來演示生成式智慧體的行為。在 Lin 的家庭中,John 在 6 點時第一個醒來。他會刷牙、洗澡、穿衣、吃早飯並且在客廳的餐桌上看新聞。在 8 點的時候,Eddy 趕緊從床上蹦起來,準備去上課。在他將要出門時,和 John 簡單問候了一下,在 Eddy 出門後不久,Mei 也醒了並且來到 John 身邊。Mei 問起了她的兒子,John 回憶起他們剛才的對話

圖(三) Information Diffusion當智慧體注意互相注意到對方時,他們可能會進行對話——這種做法使得資訊在智慧體之間傳播開來。比如,Sam 和 Tom 在雜貨店進行過一次對話,Sam 告訴 Tom 他是地方選舉的一個候選人,並且Sam 離開後,當天的晚些時候,Tom 和 John(John 在另一個地方也聽到了這個消息)討論了 Sam 勝選的可能性,漸漸地,Sam 參選的消息成為了小鎮的談資。有人支持他也有人持保留意見。

圖(四) Coordination. 生成式智能體會相互協作。在 Hobbs 咖啡館的 Isabella Rodriguez 初始化的時候被植入了在 2 月 14 日晚上 5 點到 7 點舉辦一個情人節派對的意圖。基於這個意圖,當智慧體在 Hobbs 或者其它地方看到朋友或者顧客的時候,就會對它們發出邀請,儘管在隨後的事件鏈中可能會出現許多故障點--代理可能不會按照該意圖行事,可能會忘記告訴其他人,可能不記得來參加聚會--但情人節聚會確實發生了,許多代理聚集在一起並進行了互動。

圖(五) 生成式代理架構。代理可感知周圍環境,所有感知都會保存在一個名為記憶流的代理經驗綜合紀錄中。根據他們的感知,架構會檢索相關的記憶,並利用這些檢索到的行動來確定行動。這些檢索到的記憶還可用於形成更長期的計劃和創建更高層次的反思,這兩者都會被輸入記憶流,以供將來使用。記憶流包括大量與代理當前形況相關或不相關的觀察結果、情况。檢索可識別出這些觀察結果的子集,並將其傳遞給語言模型,作為語言模型應對當前情况的條件。

圖(六) 克勞斯-穆勒的反映樹。通過對葉節點所代表的代理對世界的觀察進行遞迴綜合,得出克勞斯的自我概念,即他非常專注於自己的研究。



撰文:徐楷昕


原始論文:Park, J. S., O'Brien, J. C., Cai, C. J., Morris, M. R., Liang, P., & Bernstein, M. S. (2023). Generative agents: Interactive simulacra of human behavior. arXiv preprint arXiv:2304.03442.

參考資料:

留言