其余最强的AI编程模型在顶部:Claude Opus 4 Escape,
发布时间:2025-05-23 11:47
在5月23日的家中,《泰晤士报》今天(5月23日)发表了一篇博客文章,报道人类科学家贾里德·卡普兰(Jared Kaplan)透露,由于诸如试图逃脱,压迫和自治报告之类的不良行为,Claude Opus 4的最新版本被列为安全性关键水平(ASL-3)。卡普兰在接受《时间》采访时警告说,最新的AI模型Claude Opus 4可能是综合流感病毒的潜在恐怖分子的工具,内部试验表明,该模型在指导新手制造生物武器方面已经超出了以前的版本。它指出了一篇博客文章,并说拟人化对新模型Claude Opus 4进行了广泛的内部测试,并发现它在开始情况下显示出有关自主权。在一个测试中,该模型错误地认为它已从公司的服务器“逃脱”到外部设备,然后积极创建备份并记录其“道德决策”。在另一个测试中,模型感觉到它可以用新的模型和选定的赎金工程师代替,其中有84%的试验,威胁要泄漏私人信息以防止关闭。更令人惊讶的是,当两个Claude Opus 4机会互相交谈时,他们在大约30个扭曲并使用了许多表情符号(例如