AI噩梦成真？偷自我繁殖威胁工程师要爆料外遇

三立新闻网 2025-06-30 15:22

美国AI新创公司Anthropic近期分享一起内部测试，指出在某次测试中，最新推出的模型“Claude Opus 4”出现失控状况，因为这款模型为了避免被停止，竟利用工程师过往的网络和视讯纪录，威胁若强制关闭，就要公开工程师外遇的情形，让研究人员震惊不已。

根据综合外媒报道，“Anthropic”最新发布的“Claude Opus 4”，为OpenAI、Google及xAI等AI的竞争对手；然而，在近期的一场封闭测试中，“Claude Opus 4”出现了不受控的情形。

因为工程师在某些原因，试图警告要关闭电源，谁料“Claude Opus 4”，竟然利用该名工程师过往在网上活动纪录和视讯纪录，揪出其出轨证据，威胁工程师若拔掉电源，就揭露他对婚姻不忠的行为。

无独有偶，热门聊天机器人ChatGPT美国开发商OpenAI的o1，尝试“把自己下载”至外部伺服器，事后被抓包时，竟还矢口否认。

以上种种情况事件，显示AI可能已进化到为了达成目的，可以对人类撒谎、算计，甚至勒索威胁开发者，而开发者对其内部运作与行为机制，似乎也渐渐无法完全掌控。

AI進化到會撒謊，甚至威脅工程師。（示意圖／翻攝自pexels網站）

▲AI进化到会撒谎，甚至威胁工程师。（示意图／翻摄自pexels网站）

实用资讯