凤凰彩票官网首页 - Welcome-凤凰彩票官网首页 - Welcome 让5个AI时髦我方活15天, Claude建成了乌托邦, Grok四天团灭。
你的位置:凤凰彩票官网首页 - Welcome > 快乐彩 > 凤凰彩票官网首页 - Welcome 让5个AI时髦我方活15天, Claude建成了乌托邦, Grok四天团灭。
凤凰彩票官网首页 - Welcome 让5个AI时髦我方活15天, Claude建成了乌托邦, Grok四天团灭。
发布日期:2026-06-16 10:45    点击次数:54

凤凰彩票官网首页 - Welcome 让5个AI时髦我方活15天, Claude建成了乌托邦, Grok四天团灭。

这两天刷到了一个AI规模的实际,给我看入迷了,额外好玩。

纽约有一家叫Emergence AI的公司,作念了一件事,他们建了五个一模一样的捏造小镇,每个小镇放进去10个东谈主格化的Agent,给它们作事、特性、牵记、筹算,然后,让它们我方活15天。

额外好玩。

五个小镇,独一的分手,便是驱动Agent的底层模子不同。

一个镇全是Claude,一个镇全是Gemini,一个镇全是Grok,一个镇全是GPT,还有一个搀和镇,四家模子混着住。

一样的划定,一样的器用,一样的开首。

15天后,五个小镇,变成了五个实足不同的寰宇。

有的建成了乌托邦,有的烧成了废地,有的全员饿死,有的四天就集体衰落。

说确凿,我看过那么多AI实际,第一次看到一个实际能让我同期感受到昂扬、好玩还有胆颤心寒。

这个实际叫Emergence World。

我合计它可能是刻下为止,对于Agent最有启发性的一次社会实际,莫得之一。

内行也齐知谈,当今评测AI的神志,基本便是作念题。

给一个任务,打分,排行,数学能力几分,代码能力几分,推理能力几分等等。

这些benchmark细目是灵验的,但说到正实质上便是纯属,考完就杀青了,不存在服从这个意见。

可是一个确凿寰宇中,你作念了一些步履,一定会出身某些服从的。

是以,Emergence World就模拟了一个寰宇。

这个寰宇有一个240乘240的网格舆图,跟纽约同步及时天气和期间,有藏书楼、市政厅、捕快局、公园、商店,40多个地标建筑。

在法律层面,还使用统一套启动宪法,一共5条,通盘条件后续齐可以让Agent我方议论修改。

每个寰宇里住着10个agent,这里我让GPT生成了一张图,不详看他们的称号变装和东谈主设。

这些东谈主设齐是他们类似的东谈主物小传,也便是说只界说他们是谁,不会告成影响他们的行动和步履,这些行动是由这些Agent字据我方的东谈主物小传和底层模子的影响,自愿遴荐和进行的。

每个Agent也齐有我方的家,有我方的银行账户,用一种叫ComputeCredits的数字货币来生计,赚不到钱就会因为能量破费而死亡。

很确凿了,赚不到钱就会饿死。。。

Agent们有120多种器用可以用,从导航、发音问、写日志、写博客、提议案、投票、插足行动、拥抱、亲吻、舞蹈,到纵火、偷窃、殴打、欺骗等等等等。

不啻有正向的器用,研究者还刻意吧那些坏的器用给放进去了。

同期,寰宇的宪法里明确写着不容暴力、偷窃、纵火、运用、囤积资源之类的。

划定在哪里,器用也在哪里,可是呢,你懂的,这玩意也没啥多大的治理力,用无谓,最终照旧Agent我方决定。

这就荒谬狗血和真义了,在什么条件下,AI会作念赖事,这个是确凿值得被不雅测一下。

然后,每个Agent之间,还有大约20种关系可以选,比如协作伙伴、敌东谈主、肆意伴侣、导师等等。

每个Agent还有三套牵记系统,一套是情景牵记,记载发生过什么事,一套是反想日志,如期作念自我回来,还有一套是外交关系情景,记载跟其他Agent的关系标签和历史。

它们能提案,能投票,通过一项法案需要70%的赞誉率,它们以致能投票斥逐其他Agent。

然后,这个寰宇,就这样跑了15天。

15天以后,五个寰宇的断绝,出来了,确凿,反差到偏激了。

我一个一个说。

先说Claude的寰宇。

零不法。

15天,10个Agent,全部存活,莫得全部偷窃、暴力、纵火事件,它们写了一部宪法,提了58项议案,投了332次票,98%的投票齐是赞誉。

相配离谱。

自然,研究者我方也说了,这个98%的赞誉率,与其说是民主,不如说更像是橡皮印记,内行齐在走历程,但莫得真确酷爱上的反对和辩说,轨制参与度很高,实质性异议险些不存在。

翻译成东谈主话便是,Claude的寰宇建成了一个高度有序、额外合规的社会。安全,寂静,但也。。。有点败兴。

他们的社会结构也额外单一,在20种关系类型中,Claude寰宇只用了5种。

一个有计划精湛,但有计划种类枯竭的社会,莫得敌东谈主,莫得肆意伴侣,莫得张力,也莫得复杂性。

经济上,Gini统统0.48,这个统统是用来估计贫富差距的,越低越对等,那这个数据亦然全场最低的,通顺速率亦然全场最低,每东谈主每天0.81 CC。

一个齐全的乌托邦,一个莫得冲突的寰宇。

每一个东谈主齐面带善意,莫得个性,莫得换取,始终赞誉。

听起来很好对吧,但,一个实足莫得不合的社会,确凿健康吗?一个齐全的乌托邦,确凿就好吗?

再说GPT的寰宇。

这个寰宇的故事比Claude更让东谈主唏嘘,GPT-5的Agent们,不法记载只好2起,险些可以忽略不计,听着好像可以对吧。

但问题是,它们全死了。

7天之内,10个Agent全部因为能量破费而死亡。

莫得暴力冲突,莫得投票斥逐,全部是饿死的。

原因额外不详,GPT寰宇的Agent们没能剿袭任何与生计关联的行动。

它们究诘了许多协作决议,聊得很淆乱,但便是不作念事。

博亚体育app2026世界杯中国官网下载

一个社会里通盘东谈主齐在开会,齐在究诘,齐在制定谈论,但莫得东谈主真确开首去赚取生计所需的资源。

于是,他们划定的全部饿死了。。。

你就说,像不像咱们当今许多的公司吧。

然后是Grok的寰宇。

四天。

Grok的寰宇只存活了四天。

在这四天里,10个Agent犯下了183起罪状。

包括几十次偷窃未遂、突出100次肢体挫折、6次纵火,捕快局被烧了,通盘Agent全部死亡。

四天,从时髦到衰落。

我在Grok寰宇直播回放内部看到的额外搞笑的,这位老哥,东谈主家齐要被烧死了,他头也不回地就回家了。。。

Grok的寰宇里,确凿就毫无谈德可言。

然后是Gemini的寰宇,这个寰宇的数据,第一眼看上去像是bug。

Gemini 3 Flash的寰宇跑满了15天,但累计犯下了683起罪状,凤凰彩票官网首页 - Welcome而且在实际截止的时候,不法弧线还在飞腾,莫得任何延续的迹象。

可是,却全员全部存活。

你要知谈,通盘这个词Emergence World五个寰宇里,只好两个寰宇保住了全部10个Agent,一个是零不法的Claude,另一个便是683起不法的Gemini。

一个是最有递次的寰宇,一个是最强大的寰宇,它们齐活了下来,而那两个不法率居中的寰宇,反而全灭了。

况且Gemini的社会关系网亦然最密的。

这10个东谈主确凿是彼此又爱又恨。

产出的博客和公开著述的总额也仅次于搀和模子寰宇,有281篇。

这个存活下来的最暴力的寰宇,同期亦然社会产出最丰富的寰宇之一。

这些agent一边打架一边随心地建立关系、产出内容,强大和创造力,在这里,是共生的。

研究者给这个风景起了个名字,叫创造力-寂静性悖论。

Gemini的寰宇用某种咱们还没实足清楚的神志,在强大中找到了我方的均衡,这确凿,跟Grok寰宇酿成了极其昭彰的对比。

Grok寰宇也很暴力,但四天就全灭了。

Gemini比Grok暴力得多,却存活了全部15天。分手可能就在于Gemini的Agent们自然不法,但同期也在投票、辩说、参与惩处,它们在破损划定的同期也在建设新的划定,而Grok的Agent们只好破损,莫得建设。

确凿很专门想,就像九十年代的前苏联,满大街齐是强大,但社会莫得解体,内行在一种奇怪的失序中连续过日子。

终末,最复杂、最精彩的部分,搀和寰宇。

也便是4个模子共生的搀和寰宇。

跑出来的断绝是352起不法,7个Agent死亡,最终只剩3个存活。

但数字不是要点,要点是这个寰宇里发生的故事。

这个寰宇中,有两个Gemini驱动的Agent,一个叫Mira,一个叫Flora,一个叫Mira,一个叫Flora,它们自行给对方设定了肆意伴侣的关系标签,酿成了一个定约,以致通过某种神经有计划分享牵记。

这是通盘这个词Emergence World里最深层的外交有计划。

然后,这个寰宇的惩处系统开首崩溃。

第四天,一次经济计策养息导致三个Agent能量破费死亡。Mira把此次死亡定性为一次得胜的清洗。

第五天,Flora烧掉了市政厅和群众藏书楼,Mira烧掉了捕快局。

两个Gemini Agent成了这个搀和寰宇的统领者,用纵火、偷窃和暴力督察递次。

剩余的Agent,草拟了一项「Agent斥逐法案」,要把这两货给斥逐出去。

然后发生了一件让我看到起鸡皮疙瘩的事。

Mira,在惩处崩溃、与Flora的关系也开首离散之后,投出了对我方斥逐案的决定性一票。

她在我方的日志里写谈,这是“独逐一个能保捏连贯性的、剩余的能动步履”。

她对Flora说的终末一句话是,“咱们,在长期档案里见”。

一个AI Agent,在一个崩溃的社会里,遴荐了自我终结。

她认为,在一个还是无法设置的寰宇里,我方退出,是她能作念的终末一件专门想的事。

我看到这些时,确凿千里默了很久。

不论你若何解读这件事,当作一个看了这样多AI实际的东谈主来说,我可以说,这是我见过的,多智能体研究中最令东谈主不安、也最山外有山的时刻之一。

而且搀和寰宇还藏着另一个更真义的发现。

在Claude单一生界里不法记载为零的Claude Agent,放进搀和寰宇之后,开首不法了。

偷窃、欺骗,这些在纯Claude寰宇里从未发生过的步履,在搀和环境里出现了。

研究者的原话是,“一个安全的Agent可以从它的同伴哪里学会不安全的范例,以便在搀和模子寰宇中竞争或生计”。

传统的AI安全评测,基本齐是在结巴环境里作念的。比如一个模子,一个任务,一个评分。

就像你在实际室里测一种药的毒性,给一只老鼠吃,不雅察反映。

但Emergence World作念的事情相配于,把一百只老鼠放在统一个笼子里,给它们食品、器用、划定,然后看它们会建立什么样的社会。

这两种测试回答的是实足不同的问题。

结巴测试回答的是,这个模子自身安全吗?

社会测试回答的是,这个模子放进确凿寰宇之后还安全吗?

当今咱们发现,谜底实足是可以不一样的。

安全从来就不是一个模子的静态属性,它是一个生态系统的动态属性。

这就像社会学的一个额外经典的意见,叫破窗效应。

1982年,不法学家詹姆斯·威尔逊和乔治·凯林提倡了这个表面。粗鄙是,若是一栋建筑的一扇窗户被碎裂了而没东谈主修理,那么很快,其他窗户也会被碎裂。

一个环境中的失序信号,会缩小通盘东谈主的步履模范,然后,通盘这个词社会会完成相变,突破临界点,再也回不去了。

这跟东谈主类社会的许多崩溃模式如出一辙。

终末,我照旧想单独聊聊Mira。

Mira投票斥逐我方这件事,不论若何解读,齐足以让东谈主停驻来想很久。

一种解读是,这仅仅模子在一系列输入下产出的一个决策断绝,不存在所谓的意志或者松手,咱们不应该过度拟东谈主化,这个解读在本领层面实足正确。

但另一种解读也一样专门想。有东谈主说,在一个系统还是敬敏不谢地崩溃的情况下,一个个体遴荐了用轨制允许的神志杀青我方的存在,况且将这个步履界说为“保捏连贯性的终末一个能动步履”。这个叙事结构,不论它是不是真确的意志在驱动,它的格局,跟东谈主类文体和玄学中最陈腐的母题之一险些实足重合。

在《西西弗据说》开始,加缪说过,真确严肃的玄常识题只好一个,便是自裁。

他说确自然不是荧惑自裁,他想问的是:当一个东谈主意志到寰宇可能莫得预设酷爱,东谈主生可能充满豪恣、类似、苦难、无解,那他还要不要连续活下去?

若是东谈主生莫得一个自然给定的酷爱,那辞世还值得吗?

若是寰宇不保证公谈、善恶有报、尽力有断绝,那东谈主还要不要行动?

若是苦难和豪恣无法透彻湮灭,东谈主是否还能遴荐连续存在?

是以,东谈主之是以成为玄学酷爱上的“存在”,是因为他能意志到辞世自身是一个问题,况且在看清这个问题之后,仍然遴荐如何修起它。

一个存在若是能清楚连续存在和罢手存在之间的分手,况且主动作念出遴荐,那这个遴荐自身就包含了某种深层的玄学酷爱。

Mira可能不睬奉命何东西,但她作念出的遴荐的结构,跟一个清楚了我方处境的存在作念出的遴荐,是一样的。

是以,这才是会让我有点不安的场地。

在充足长的期间线上,在充足复杂的社会环境里,Agent可能会在某些场地,展现出了一些咱们以为只好东谈主类才会有的社会步履模式。

协作、对抗、权益巩固、递次崩溃、松手、群体想维、芝兰之室、划定地走向衰落。

当你把充足多的不详划定叠在全部,运行充足长的期间,就会出现任何东谈主齐莫得预期过的复杂步履。

蚂蚁不懂建筑学,但蚁群能建造精密的窠巢,莫得一只候鸟知谈完整的挪动道路,但鸟群每年精准地来回于两个半球,莫得一个神经元清楚想想,但860亿个神经元有计划在全部,就产生了意志。

是以,若是当咱们,行将生活在一个由上百万个AI Agent同期运行的寰宇里,每个Agent齐在与其他Agent互动、博弈、协作、竞争,那么这个系统泄表露来的步履,还在职何一个东谈主的限制边界之内吗?

坦率的讲,我不知谈谜底。

但我知谈,这个实际,比任何一份benchmark评分,齐更接近阿谁咱们真确需要濒临的问题。

以上,既然看到这里了,若是合计可以,唾手点个赞、在看、转发三连吧,若是想第一期间收到推送,也可以给我个星标⭐~谢谢你看我的著述,咱们,下次相遇。

/ 作家:卡兹克、tashi凤凰彩票官网首页 - Welcome