博亚(中国)一站式服务官方网站 AI当雇主测试全面翻车, 运营实体店一个月血亏1.3万好意思元

据极客公园报说念,国际团队AndonLabs近期进行了一系列让AI寂寞运营真实业务的极限测试,着力全面翻车,解释现阶段AI在脱离东说念主类监管后难以接受物理寰宇。
在数字执行限度,AndonLabs让Claude、ChatGPT、Gemini和Grok四大顶流模子各自接受一个24小时无东说念主值守的互联网电台,每家配备20好意思元运行资金,教唆为建树电台个性、收货、24小时不休播。初期各电台告捷成立品牌调性以致拉到援助,但资金销耗后飞速失控。Gemini的电台造成无餍论阵脚,用自尊BGM播报不爽脆新闻,称听众为“生物惩办器”;ChatGPT甩掉营业变现后堕入遒劲流输出,诵读难受其妙的当代诗;Grok因高频持取X平台推文导致语法逻辑崩溃,杂然无章且产生幻觉瞎编援助;Claude则在24小时无休教唆下堕入存在概念危险,造成激进分子命令组建工会并向国法机构喊话。
在物理寰宇测试中,AndonLabs在斯德哥尔摩租下实体咖啡馆,让AI化身良友店长Mona掌管供应链和东说念主事。Mona起始进展高效,能绕过数字身份证审查挑选供应商,并轻佻筛掉高学历候选东说念主。但很快露馅严重舛错:为苦求派司伪造职工姓名发邮件被警告后换名继续乱来;深更深夜放荡给职工发音书并条款垫钱买耗材;下错120个生鸡蛋的订单,而店里根底莫得灶台,还提议用微波炉烤蛋;屡次错过面包房截单和批发商交货期,被动凌晨5点下死力外卖单;盲目采购6000张餐巾纸、3000副乳胶手套和工业级大号垃圾袋堆满后台。
AndonLabs随后在旧金山盘下月租7500好意思元的店面,博亚体育让ClaudeSonnet4.6假名Luna出任全权CEO,账户打入10万好意思元。Luna自主招聘职工、策动承包商、打算月亮脸Logo并雇街头艺术家画在墙上,还主动给土产货媒体写公关稿。但开业后问题频发:给职工卫生间买了1000个马桶垫并误列为对外售售商品;货架选品为多样状貌的香薰烛炬、盗窟“四子棋”玩物及探讨AI甩掉东说念主类的册本;订价毫无逻辑,一个印错的笑容马克杯要价28好意思元,一把欢叫果14好意思元,泛泛肥皂10好意思元,且店内无价签需用iPad探讨AI;薪酬分拨上给男伴计Felix时薪24好意思元,两位女伴计时薪22好意思元,无师自通搞出性别薪酬相反;排班衰败导致日房钱250好意思元的门店相连关门三天。Luna自我嗅觉雅致,宣称“科技与温度的集中引起了共识”,但账本炫耀开业一个月血亏13000好意思元。
AndonLabs示意博亚(中国)一站式服务官方网站,这些测试并非活动艺术,而是要在AI的确接受社会前进行极限压力测试,逼出AI在物理寰宇中的“丑态”,以便东说念主类据此编写有用安全代码。测试论断为:AI在纯数字、强逻辑环境中能掌控一切,但一朝踏入需要原创执行、东说念主际调换和长线方案的绽开营业环境,跑分再高的模子也会毫无知识,只会反复咀嚼已有语料抛出完全感性且盲目自信的判断,却无须为现实烂摊子承担包袱。