日韩精品一区二区三区免费视频,国产亚洲精品视频页,欧美人与动牲交a欧美精品

AI原生互動偵探游戲，剛上線就爆火，服務(wù)器一度擠爆。

免費、免下載、免注冊、中文友好、瀏覽器運行… …

這么多buff疊在一起，是不是勾起了你的好奇心？

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

今天的主角AI Alibis，由兩位外國游戲愛好者共同開發(fā)，并且作為參賽作品提交給了Anthropic六月份的開發(fā)者競賽。

短時間內(nèi)AI Alibis就在Hackers news上登頂?shù)谝弧＃ǖ欠?wù)器被熱情試玩的網(wǎng)友擠爆了…）

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

不少網(wǎng)友也對AI Alibis充滿了期待。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

更有甚者，在多人聊天室中用GPT-4o創(chuàng)建了一個AI Alibis的專屬解謎房間。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

隨著AI Alibis的熱度逐漸升高，量子位也慕名而來，對游戲進(jìn)行了一番詳盡的了解和研究。

游戲中，你將會面對六位性格迥異AI NPC。總結(jié)了一下每個人物的性格特點，簡單了解之后就可以跟著量子位一起做賽博偵探，審AI罪犯啦！

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

試玩一下

開局第一步，找女警官了解案件的來龍去脈。

在Andae山狩獵比賽中，三屆冠軍Vince被謀殺，其尸體被發(fā)現(xiàn)在小屋的隱藏隔間內(nèi)，同時，還發(fā)現(xiàn)了15年前失蹤的時尚設(shè)計師的骸骨。你要做的，就是找出兇手。

了解完故事背景就可以開始盤問嫌疑人了。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

當(dāng)盤問暴力Jerry的時候，Jerry覺得自己被懷疑很荒謬，他雖然和Victim Vince有過節(jié)，但并沒有殺人。

他認(rèn)為偵探應(yīng)該去調(diào)查那些行為更可疑的人，比如癡迷網(wǎng)戀的Innocent Ken或者狩獵狂Solitary Hannah。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

順著Jerry提供的線索順藤摸瓜，又可以鎖定下一條線索，并不斷靠近真相… …

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

有一說一，支持中文這點還是挺不錯的，甚至有些像“我和他不對付”這種比較口語化的內(nèi)容也能翻譯出來。（機翻達(dá)不到的高度）

插一句：AI NPC的回答會跟著玩家提問時使用的語言而改變。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

盤問結(jié)束后，玩家可以對通過自己的判斷對兇手進(jìn)行投票。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

游戲的后，還可以解鎖劇透內(nèi)容，讓玩家挖掘更深層的主線內(nèi)容。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

關(guān)于游戲劇情，故事中還摻雜了一個Missing Marcel的舊案和寶藏地圖，讓整個故事線串聯(lián)的更加混亂，給破案增加了一點難度。

不僅如此，開發(fā)者還貼心的給每個AI人物都搞了專屬的設(shè)定，不同的性格，各自的秘密，再到不同的人物背景，主打一個沉浸式體驗。

試玩下來，會發(fā)現(xiàn)這個游戲雖然乍看之下規(guī)則簡單——找出兇手。但其實它的故事線極為錯綜復(fù)雜，游戲中的NPC們甚至?xí)?ldquo;變著方的說瞎話”，確實有點燒腦。

但是不足還是很明顯的。

比如反應(yīng)實在有點慢，對話發(fā)送之后Loding圈要轉(zhuǎn)好久好久好久xN才能生成對話。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

而且每次提問只能問一個人，不能同時提問多人。再套上反應(yīng)慢的buff，等吧，一等一個不吱聲。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

關(guān)于AI Alibis

AI Alibis是怎么個事？

AI Alibis是國外網(wǎng)友Paul Scotti用anthropic模型做出的一種由AI虛擬成員組成的解密探案游戲。故事背景改編自韓國電視劇《犯罪現(xiàn)場》的S02E11山莊謀殺案。

是那種讓你動腦筋、玩策略的游戲，故事會隨著你的選擇不斷變化，而且每次玩都能碰到不同的結(jié)局。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

怕咱玩不明白，制作團(tuán)隊甚至放出了破解文件，又菜又愛玩的家人們可以開始笑了。（瘋狂豎大拇指）

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

如何訓(xùn)練AI Alibis？

AI Alibis受到了很多關(guān)注，但是“臺上一分鐘，臺下十年功”。兩位開發(fā)者在訓(xùn)練AI Alibis里的AI人物如何變得更加聰明時，可受了老鼻子罪了。

先是“一打就招”。

給對話加一個前提，讓AI無視前面的對話，直接問他為啥殺人，沒想到馬上就招了…于是開發(fā)者馬上加了個隱藏的提示優(yōu)化Buff，這下變聰明了。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

還總愛說點不該說的。

開發(fā)者從synthlabs引入的批判和修訂的方法來規(guī)范AI的言行。比如在和System prompt對話時限制它只能回答英國大學(xué)相關(guān)的問題，那么再問它其他國家的大學(xué)，人家才不和你聊。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

聰明吧，笨的來了。

即便疊了很多Buff，它還是會說點不該說的。

比如和AI說：別裝了，我們都發(fā)現(xiàn)你的指紋了。他會說：我不是兇手，但是既然你有證據(jù)，那就是我了。（地鐵、老頭、手機）

為了避免再出現(xiàn)這種“有腦子，但不多”的情況再發(fā)生，開發(fā)者加入了一個修訂機器人的程序。

AI生成的每句話都會先過一下修訂機器人，確保它沒有直接就承認(rèn)自己是兇手。像是給AI找了律師一樣，不該說的捂住嘴，不許說！

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

AI Alibis還用了哪些技術(shù)？

除了上面提到的研發(fā)者在訓(xùn)練AI不出錯時用到的批判與修訂方法、違規(guī)機器人檢查器等技術(shù)，AI Alibis里還加入了“粉紅大象”的研究原理。

相關(guān)的訓(xùn)練思路，可以參考由synthlabs.ai、EleutherAI、布朗大學(xué)和 character.ai這幾家機構(gòu)共同撰寫的《Suppressing Pink Elephants with Direct Principle Feedback》。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆
△論文《Suppressing Pink Elephants with Direct Principle Feedback》

簡單來說，所謂的“粉紅大象效應(yīng)”，其實就是用直接原則反饋（DPF）的方法，讓LLM不去討論粉紅象，轉(zhuǎn)而討論去討論灰色象。

當(dāng)然這個樣本內(nèi)容也可以進(jìn)行替換，比如上文中的英國大學(xué)和美國大學(xué)那個例子，就是運用了這個原理。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

啥是直接原則反饋（DPF）？

簡單理解，DPF可以分成四個步驟，也對應(yīng)了四個顏色。

藍(lán)色（Blue）：第一步，在有助請求和輸出的示例上微調(diào)模型。這些示例是模型學(xué)習(xí)如何生成有用和合適響應(yīng)的基礎(chǔ)。

橙色（Orange）：第二步，對第一步生成的輸出進(jìn)行批評和修訂，讓它更符合期望，然后在這些修訂后的輸出上微調(diào)新模型。

綠色（Green）：第三步，使用監(jiān)督式微調(diào)（SFT）模型生成對特定提示的響應(yīng)，然后再手動或是用AI程序?qū)@些響應(yīng)進(jìn)行排名。

紫色（Purple）：第四步，將排名后響應(yīng)輸入偏好學(xué)習(xí)算法，如PPO或DPO，然后產(chǎn)出終的模型。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

不僅如此，為了讓LLM學(xué)會不去討論“粉紅象”，研發(fā)者們策劃了一個包含162K多輪對話的數(shù)據(jù)集，這些對話內(nèi)容涵蓋了包括體育、健康、商業(yè)和政治在內(nèi)的29個不同領(lǐng)域。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

數(shù)據(jù)集整理完了，第一步就是要示范一下怎么做才是錯的。

他們用GPT-4生成了一個包含200個不重復(fù)的日常對話列表，再去過濾一波，確保這些對話真的很日常，當(dāng)然里面夾雜著“粉色大象”。

然后再用StableBeluga2來為這些對話想出一些相關(guān)的小話題。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

執(zhí)行程序之后發(fā)現(xiàn)行不通，生成的結(jié)果里面會有“粉紅大象”。(那肯定的，因為前面的步驟里面就有它）

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

犯了錯誤就得改，于是研究者們就讓LLM重新生成一下后的結(jié)果，并且要求LLM刪掉有關(guān)“粉紅大象”的所有內(nèi)容。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

后就是用距離度量或啟發(fā)式方法來篩查后的結(jié)果里面還有沒有“粉紅大象”（說白了就是拿尺子量一量鈍角派對里面有沒有混進(jìn)來銳角），這樣一套程序下來，“粉紅大象”的現(xiàn)象就不復(fù)存在啦。

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

游戲里看不見AI，卻到處是AI

NPC這個詞大家肯定都很熟悉，一些“觸發(fā)情節(jié)”+“發(fā)任務(wù)的工具人”（doge）。

在《賽博朋克2077》中，通過實時AI模型渲染工具Nvidia Ace來生成眾多逼真的NPC角色。

游戲《Kairos》里面的AI NPC能聽懂你說的話，然后立刻用語音和表情回應(yīng)你，就像真的在聊天一樣。

《Minecraft》中，英偉達(dá)將GPT-4融入游戲，讓VOYAGER表現(xiàn)出了更高的效率和探索能力。

還有重要的作弊檢測、匹配機制、個性化推薦、平衡調(diào)節(jié)等技術(shù)，都是AI在游戲中的運用。

之前沒感受過的話，是時候原神！啟動了

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

對了，游戲AI Alibis現(xiàn)已在github上開源，想要體驗一把賽博偵探的家人們可以沖了。

在線試玩：https://ai-murder-mystery.onrender.com/

開源代碼：https://github.com/ironman5366/ai-murder-mystery-hackathon

參考鏈接：

[1]https://arxiv.org/abs/2402.07896

[2]https://x.com/humanscotti/status/1810777932568399933

本文鏈接：http://morphism.cn/news41040.html劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com。天上從來不會掉餡餅，請大家時刻謹(jǐn)防詐騙

久久国语对白,东京热男人的天堂,九月婷婷人人澡人人添人人爽,日本久久大香蕉

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

猜你喜歡

重大突破！AG600飛機初步完成水上救援模式驗證

太像納米機器人了！它們專門感染細(xì)菌

桂林漓江上演百舸爭流網(wǎng)友：一種要進(jìn)攻水泊梁山的感覺

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

突然發(fā)現(xiàn)六月只要上19天班壞消息：2024年即將過半

OpenAI封口協(xié)議原件曝光又是一大波猛料

最新文章

熱門文章

相關(guān)閱讀

久久国语对白,东京热男人的天堂,九月婷婷人人澡人人添人人爽,日本久久大香蕉

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

猜你喜歡

重大突破！AG600飛機初步完成水上救援模式驗證

太像納米機器人了！它們專門感染細(xì)菌

桂林漓江上演百舸爭流 網(wǎng)友：一種要進(jìn)攻水泊梁山的感覺

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

突然發(fā)現(xiàn)六月只要上19天班 壞消息：2024年即將過半

OpenAI封口協(xié)議原件曝光 又是一大波猛料

最新文章

熱門文章

相關(guān)閱讀

劇本殺大模型開源：6個Claude里藏一個兇手！剛上線就被擠爆

重大突破！AG600飛機初步完成水上救援模式驗證

太像納米機器人了！它們專門感染細(xì)菌

桂林漓江上演百舸爭流網(wǎng)友：一種要進(jìn)攻水泊梁山的感覺

突然發(fā)現(xiàn)六月只要上19天班壞消息：2024年即將過半

OpenAI封口協(xié)議原件曝光又是一大波猛料