NPC有靈魂了嗎?大語言模型與智能體設計的新進展
游戲帶來的獨特體驗在于讓人沉浸在一個引人入勝的世界與故事中,并讓人經(jīng)歷一段與眾不同的旅途。其中的情節(jié)與世界觀又往往通過玩家與NPC的互動一點一點展開。然而,無論NPC有多生動,程序設置的本質終會提醒我們:你面前的并非某個角色,而是游戲制作者。
(資料圖片僅供參考)
因此,許多玩家渴望一個開放世界,到處是與人類無異的智能NPC,如《西部世界》或《刀劍神域》中那般。在AI技術跳躍式發(fā)展的2023年,我們似乎能看到一些雛形與嘗試。
《瑞克和莫蒂》中的電池宇宙
斯坦福和Google的研究團隊近期設計了一個實驗并發(fā)表了論文,目的是驗證AI是否已經(jīng)達到可以模擬人類復雜社交互動的程度。
自由聊天?不,是虛擬生活
在實驗中,研究人員創(chuàng)建了25個AI虛擬角色,每個角色都設定了獨特的個人信息,包括姓名、職業(yè)、人生目標等,這些AI角色被置入一個小鎮(zhèn)中。基于大語言模型技術,這個虛擬小鎮(zhèn)上的AI能夠進行日常生活對話,對環(huán)境進行交互。雖然并不完美,但已為其在更真實場景下模擬人類豐富社交提供了基礎。
它們能自發(fā)產(chǎn)生話題,傳播信息,就公共事務形成不同觀點。在實驗的虛擬小鎮(zhèn)環(huán)境下,AI角色Sam宣布要競選市長,這一信息很快在其他AI角色之間傳播開來。其中,Tom表示支持Sam的決定,因為Sam一直致力于小區(qū)工作,可以為小區(qū)發(fā)展作出新貢獻。Tom后來與John討論Sam的選舉勝算,兩人都預期Sam會成功當選。
Sam要競選市長的消息成為虛擬小鎮(zhèn)的熱門話題,一些AI角色表示支持,一些則持觀望態(tài)度。盡管AI角色的對話并不總是自然流暢,但能在一定程度上模擬人類社會關系的復雜性,實現(xiàn)信息的有效傳播和討論,形成不同的立場和態(tài)度。
在虛擬小鎮(zhèn)實驗中,AI角色Isabella的初始設定是需要在情人節(jié)舉行一個派對。Isabella在咖啡館工作,她逢人便邀請其他AI角色參加她的派對。Isabella的女兒Maria也邀請她暗戀的對象Klaus來參加。除Isabella舉辦派對和Maria暗戀Klaus的初始設定外,其他行為如傳播派對信息、布置派對場地、邀請其他人等完全由AI自主完成。
在NPC的八卦下,最終有12個AI角色知曉這個派對信息,但只有5個角色實際出席,包括這對相互暗戀的角色Maria和Klaus。其他7個AI角色沒有出席,研究人員后來分析了他們的理由,有4個原本表示有興趣但沒來,另外3個找了其他的理由。這里AI展現(xiàn)出一定的觀察力和反思能力,可以在一定程度上解釋角色放鴿子的理由。
NPC是如何有靈魂的?
那么研究團隊具體是如何讓這些NPC看起來更“人性化”的呢?他們制定了一種智能體架構來檢索記憶,動態(tài)地更新他們過去的經(jīng)驗,并將其與智能體的上下文和計劃結合,這些經(jīng)驗、上下文和計劃可能相互加強或相互矛盾。整個架構有三個主要的組件:記憶、計劃和反思。每個組件負責執(zhí)行特定的功能。
在記憶與檢索的方法中,記憶流將智能體當前的經(jīng)歷和觀察提供給語言模型,語言模型據(jù)此可以輸出更加符合人類行為的指令與內(nèi)容。檢索功能則會根據(jù)不同的情況進行選擇,如最近訪問的事件以及事件的重要性與相關性。這些方法有助于語言模型選擇與當前情況相關且重要的記憶,讓智能體的反應更加連貫和具體。
計劃描述了智能體未來的行動序列,并幫助智能體的行為隨時間保持一致。一個計劃包括位置、開始時間和持續(xù)時間。例如,快到截止日期時,Klaus可能選擇把一天時間花在桌前起草研究論文。
反思則是一種更高級別的記憶,可以回顧記憶和做出更高層次的推理。當智能體對事件的感知達到一定閾值時就會進行反思,根據(jù)智能體近期經(jīng)歷提出的問題,然后,語言模型進行回答并引用相關記憶作為證據(jù)。問Klaus最想與誰在一起,他選擇Maria而不是與他互動最頻繁的人,因為Klaus熱衷學術研究,而Maria也總是在做學術研究。
最后,研究者還讓25名人類參與者來評估不同類型的智能體在人性方面的可信度。結果顯示,生成式智能體雖然在語言產(chǎn)生方面達到較高水平,但在理解和生成非語言信息方面,如個性、情感和社交性等方面,其水平還不及人類。自然語言模型在非語言的理解與生成方面存在局限,而如何解決與克服這一局限也是未來研究的方向。
大語言模型會顛覆傳統(tǒng)AI嗎?
在以往的游戲中,虛擬世界中的角色時有真實之感,這歸因于游戲創(chuàng)作者在游戲性與故事性之間的完美平衡,以及玩家在游戲中同人物與環(huán)境互動的沉浸感。
我們也能實際體驗到游戲中NPC的智能化?!痘囊按箸S客2》里NPC會記得玩家曾經(jīng)幫他吸出過蛇毒,再次相遇時會給予感恩和回報?!段讕?》開場支線任務里的NPC會欺騙并利用并玩家的善良來達到自己的目的。但這些游戲一般采用編寫AI行為的方法來與玩家展開互動性敘事,如有限狀態(tài)機和行為樹等。
當人們說AI會取代人類時網(wǎng)友就會掏出這張圖
雖然它們可以處理基本的社交互動,但不可能完全涵蓋開放世界中所有可能的互動行為范圍??紤]到制作人員的工作量和效率,這些方法通常簡化了環(huán)境或行為的維度,尚未解決在開放世界中可信智能體的問題。
較為開放的沙盒游戲如《矮人要塞》和《環(huán)世界》是敘事過程生成技術的典范。里面每個NPC都在編寫自己的個人歷史,細看卻發(fā)現(xiàn)某些事件之間還是缺乏關聯(lián)性和邏輯性。
使用機器算法訓練的AI往往出現(xiàn)在那些易于定義獎勵的對抗游戲中,這些獎勵可以被學習算法優(yōu)化。這種方式設計出的AI非常智能,在某些方面甚至超越人類,如星際爭霸戰(zhàn)中的Alpha Star和Dota 2中的Rerun能擊敗職業(yè)選手。
可以看出,傳統(tǒng)的基于狀態(tài)機、行為樹的而設計的AI和較近的基于深度學習設計的AI在游戲中都有各自典型的運用。斯坦福大學的這個研究項目巧妙地向我們展示了如何將GPT-3.5這種基于深度學習的大語言模型融入游戲之中?,F(xiàn)在,讓游戲中的AI與玩家直接對話也不是什么新鮮事了。
一款使用大語言模型的游戲《Origins》就曾有玩家上傳了游戲實機體驗視頻。就目前的演示來看,玩家可以直接與游戲內(nèi)NPC對話,去詢問證人找出事件真相。玩家分別與清潔機器人和人類進行了對話,與機器人的對話較為流暢,但人類這邊的語調(diào)和表情就“機械感”十足,相當違和。
《輻射4》近期也出現(xiàn)了一款可以為游戲自動生成對話和全程配音的Mod。目前該Mod為游戲添加300多條全新對話,在一定程度上解決《輻射4》“對話輪系統(tǒng)”的限制, “對話輪系統(tǒng)”只提供了四種選項,限制了玩家的自由度。AI生成的聲音已經(jīng)與原聲非常相近,但目前聽起來還是略微“缺乏感情”。
SE免費新作《SE AI技術預覽:港口鎮(zhèn)連續(xù)殺人事件》一經(jīng)推出就“特別差評”,好評率不足10%。據(jù)介紹,這款游戲運用多種AI技術,自然語言處理(NLP)、自然語言理解(NLU)、語音轉文字(STT)等。實際體驗下來所謂的自由對話就是純噱頭,只有在提到某些觸發(fā)詞或關鍵詞時,NPC才會生成實質性的、有價值的對話。
連自己內(nèi)褲的顏色都不知道?
當然運用這項技術的游戲遠不止這些,在實際體驗中也能夠明顯地感受到這項技術中瑕疵的、機械化的一面。
即使是當今最強大的語言模型GPT-4,其本質更多的是一個統(tǒng)計學原理的概率模型,它的出發(fā)點并不是邏輯和語義?!澳魏伪救藳]文化,一句臥槽行天下?!痹谌粘I钪?,語言與行為活動密不可分,只言片語就能表達豐富的涵義。哲學家維特根斯坦的“語言游戲”就說明了這點,深究語言的本質只會走入死胡同,語言的使用比語法更重要,我們需要考慮實際的應用場景。
而到了算力有限,系統(tǒng)交互同樣復雜的游戲中,目前的AI在游戲上還是有點捉襟見肘了,它們無法理解語言符號和非語言符號的關聯(lián)。就目前來看,利用AI技術縮減游戲開發(fā)中的重復性工作和流程,游戲開發(fā)商投入更多成本和資源到游戲內(nèi)容和體驗本身的開發(fā)上,這可能是一條更加符合實際需求和發(fā)展趨勢的道路。至于未來,我們不妨大膽展望,西部世界在有生之年或許能夠實現(xiàn)。畢竟世界上第一架飛機只飛行了36.6米,而短短六十年,人們就可以在云端俯瞰生靈,宣告頭頂并沒有什么上帝。
標簽:
- 信陽市中招考試時間 信陽市83929名考生(僅指九年級考生)報考 全球觀焦點
- 環(huán)球時訊:分紅轉股對上市公司有什么影響?分紅轉股后自己的股票數(shù)有什么變化?
- 端午假期天津重點商貿(mào)流通企業(yè)銷售超9億元同比增長38.1%|焦點信息
- 今日觀點!醫(yī)保怎么交費?城鄉(xiāng)醫(yī)保怎么交費?醫(yī)保忘了交費能補交嗎?
- 世界今頭條!無繩電話輻射大嗎?無繩電話通話距離是多少米?
- 無繩電話輻射大嗎?無繩電話一般在多少米范圍內(nèi)有效?-速看
- 環(huán)球熱消息:突發(fā)!又一名中行高管被查,已退休數(shù)年
- 環(huán)球實時:電腦玩dnf沒有聲音是什么問題?dnf進游戲沒聲音怎么辦?
- 股指期貨仿真交易軟件有哪些?股指期貨交易規(guī)則有什么?|焦點熱門
- 基金凈值為什么會暴跌?基金的巨額贖回會有什么影響?
- 股票為什么會跌破發(fā)行價?LPR機制改革對股市有沒有影響?|最新消息
- 為什么設立基金定投止盈點 寶盈新銳靈活混A的綜合分析
- 焦點訊息:一般水庫搬遷賠多少錢?國有劃撥土地是否有拆遷補償?
- 觀天下!科創(chuàng)板解禁時間是多久 科創(chuàng)板解禁是利空嗎?
- 產(chǎn)品組合縮減策略的方式怎么樣? 產(chǎn)品組合縮減策略的優(yōu)點有什么?
- 熱點在線丨個人所得稅是交百分之多少?勞務報酬個人所得稅稅率是多少?
- 世界最資訊丨惠氏奶粉屬于什么檔次?惠氏奶粉是國產(chǎn)還是進口?
- 全球熱文:股東退出的主要方式有哪些?股東退出需要什么手續(xù)?
- 信用卡風控是什么意思?信用卡風控多久可以恢復?
- 法院裁判網(wǎng)app(法院裁判網(wǎng)官網(wǎng)) 世界最新
- win10系統(tǒng)怎么關閉軟驅?華碩bios怎么關閉軟驅?
- 存款利息少了怎么回事?為什么現(xiàn)在存款利息越來越低?
- keynote文字怎么添加火花穿過的動畫效果?keynote怎么制作放大動畫?
- 股票大單壓盤是什么意思?大單壓盤是要漲還是要跌?|全球快播
- 【全球快播報】紅色痘痘涂什么藥膏?推薦祛痘效果好的產(chǎn)品2023!
- 基金收益的計算公式是什么?基金當天賣出收益如何算?|世界即時
- 為什么本科學校有????專科勢力比較強的大學有哪些?
- 【新視野】票面利率計算公式是什么?票面利率怎么算?
- 普通家庭買車什么價位合適?普通家庭有必要買20萬的車嗎?-最新消息
- 【速看料】公司退市之后還能重新上市嗎?股票退市我的持倉沒了?
- 信陽市中招考試時間 信陽市83929名考生(
- 環(huán)球時訊:分紅轉股對上市公司有什么影響?
- 端午假期天津重點商貿(mào)流通企業(yè)銷售超9億元
- 今日觀點!醫(yī)保怎么交費?城鄉(xiāng)醫(yī)保怎么交費
- 世界今頭條!無繩電話輻射大嗎?無繩電話通
- 無繩電話輻射大嗎?無繩電話一般在多少米范
- 環(huán)球熱消息:突發(fā)!又一名中行高管被查,已
- 環(huán)球實時:電腦玩dnf沒有聲音是什么問題?d
- 股指期貨仿真交易軟件有哪些?股指期貨交易
- 基金凈值為什么會暴跌?基金的巨額贖回會有
- 股票為什么會跌破發(fā)行價?LPR機制改革對股
- 為什么設立基金定投止盈點 寶盈新銳靈活混
- 焦點訊息:一般水庫搬遷賠多少錢?國有劃撥
- 觀天下!科創(chuàng)板解禁時間是多久
- 產(chǎn)品組合縮減策略的方式怎么樣? 產(chǎn)
- 熱點在線丨個人所得稅是交百分之多少?勞務
- 世界最資訊丨惠氏奶粉屬于什么檔次?惠氏奶
- 全球熱文:股東退出的主要方式有哪些?股東
- 信用卡風控是什么意思?信用卡風控多久可以
- 法院裁判網(wǎng)app(法院裁判網(wǎng)官網(wǎng)) 世界最新
- win10系統(tǒng)怎么關閉軟驅?華碩bios怎么關閉
- 存款利息少了怎么回事?為什么現(xiàn)在存款利息
- keynote文字怎么添加火花穿過的動畫效果?k
- 股票大單壓盤是什么意思?大單壓盤是要漲還
- 【全球快播報】紅色痘痘涂什么藥膏?推薦祛
- 基金收益的計算公式是什么?基金當天賣出收
- 【新視野】票面利率計算公式是什么?票面利
- 普通家庭買車什么價位合適?普通家庭有必要
- 【速看料】公司退市之后還能重新上市嗎?股