AI噩梦成真?偷自我繁殖 威胁工程师要爆料外遇

三立新闻网 2025-06-30 15:22+-

美国AI新创公司Anthropic近期分享一起内部测试,指出在某次测试中,最新推出的模型“Claude Opus 4”出现失控状况,因为这款模型为了避免被停止,竟利用工程师过往的网络和视讯纪录,威胁若强制关闭,就要公开工程师外遇的情形,让研究人员震惊不已。

根据综合外媒报道,“Anthropic”最新发布的“Claude Opus 4”,为OpenAI、Google及xAI等AI的竞争对手;然而,在近期的一场封闭测试中,“Claude Opus 4”出现了不受控的情形。

因为工程师在某些原因,试图警告要关闭电源,谁料“Claude Opus 4”,竟然利用该名工程师过往在网上活动纪录和视讯纪录,揪出其出轨证据,威胁工程师若拔掉电源,就揭露他对婚姻不忠的行为。

无独有偶,热门聊天机器人ChatGPT美国开发商OpenAI的o1,尝试“把自己下载”至外部伺服器,事后被抓包时,竟还矢口否认。

以上种种情况事件,显示AI可能已进化到为了达成目的,可以对人类撒谎、算计,甚至勒索威胁开发者,而开发者对其内部运作与行为机制,似乎也渐渐无法完全掌控。

AI進化到會撒謊,甚至威脅工程師。(示意圖/翻攝自pexels網站)

▲AI进化到会撒谎,甚至威胁工程师。(示意图/翻摄自pexels网站)