风暴正在酝酿
中国人工智能公司“深度求索”(DeepSeek)在AI研发上的异常表现引发美议员关注。
周一(1月27日),中国人工智能公司DeepSeek引发华尔街震荡,导致市值蒸发近6000亿美元,成为美股史上规模最大的一次金融冲击事件。
DeepSeek发布的R1推理模型,其表现超越一众美国开源语言模型。这让许多人工智能研究人员和美国官员感到惊讶和质疑。
众议院对中共委员会委员会主席、共和党联邦众议员约翰‧穆勒纳尔(John Moolenaar)表示,美国政府应努力对DeepSeek AI基础设施关键技术实施更严格的出口管制。
参议院少数党领袖、民主党联邦参议员查克‧舒默(Chuck Schumer)表示,“我们的竞争对手将利用他们得到的每一个机会超越美国在未来技术领域的领先地位。我们必须引领潮流。”
舒默表示,他将继续致力于将发展美国人工智能放到最高优先事宜上。
美股暴跌 奇怪的延迟反应
彭博社说,DeepSeek引发美股暴跌是一种奇怪的延迟反应。周一引发的对美国高科技公司股票的抛售,实际上是投资者可能采取行动的第五个交易日。
DeepSeek在1月20日发布了这款应用程序,那天是美国总统就职典礼日。一开始,外界对它并没有太多关注,到了24日,涉及DeepSeek的新闻开始激增。当天网络上突然出现878篇相关报道,比前一天多出了接近600篇。
紧接着周末,DeepSeek在社交媒体上出现得越来越多。到了26日晚上,根据Google Trends的显示,对DeepSeek的搜索活动激增。
2024年9月10日,共和党联邦众议员穆勒纳尔(John Moolenaar)在新闻发布会上发言。 (Kent Nishimura/Getty Images)
市场对新闻的反应应该是随机的,但一般来说,当新闻刚出炉时,市场会试图做出迅速反应。而关于DeepSeek的报道已经存在了好几个月。
报道指出,在社交媒体时代,信息达到临界点然后突然传播开来很常见,不过当DeepSeek的信息突然聚集了临界点,并在27日一天内造成了华尔街5800亿美元的损失,肯定很难有别的故事能与之匹敌。
“低成本训练”具误导性
外界质疑DeepSeek低成本训练有很大的误导性,此外,其使用非高端芯片进行训练也存在疑问。
DeepSeek在2024年12月发布了一份报告,声称他们即将在1月10日推出的免费开源大型语言模型V3在多项数据上超越国内外一众大模型产品。该公司声称该模型仅用两个月就建成,成本仅为557万美元,且使用非高端的H800芯片训练。
557万美元忽略了DeepSeek背后的重要基础设施,包括大量可能将实际成本推高至数亿美元的芯片。
它在报告中也说,这些成本并不包括与架构、算法或数据方面的先前研究和实验相关的所有其它成本。
1月20日,该公司发布了一个推理模型R1,称性能比肩OpenAI o1正式版。他们未公布R1的成本数据。
但557万美元却成为了美国媒体报道的噱头,同时也被混淆为是R1的成本。如伯恩斯坦研究公司高级分析师斯泰西‧拉斯贡(Stacy Rasgon)调侃说:“DeepSeek真的‘以五百多万美元创立了OpenAI’吗?当然不是。”
非高端芯片谜团
美国从事数据标注服务的领先公司Scale AI的CEO亚历山德‧王(Alexandr Wang)指出,DeepSeek可能实际拥有50,000颗H100 GPU,但可能因出口管制限制而无法公开此事。
Futurum Group执行长丹尼尔‧纽曼(Daniel Newman)也认为,倘若DeepSeek获取不该拥有的设备,一定会招来进一步的调查。他预计美国政府将调查DeepSeek的硬件是否违反出口禁令。
总部位于杭州的初创公司DeepSeek表示,它使用英伟达(Nvidia,辉达)H800芯片来构建模型,该模型一直可用,直到2023年10月美国政府扩大禁令。
根据公开信息和DeepSeek创办人梁文锋接受大陆媒体采访的报道,早在预期的美国制裁实施之前,梁就购买了大量英伟达A100芯片,这种芯片目前已被禁止出口到中国。
中国科技刊物“36氪”(36Kr)估计,该公司库存芯片超过1万片,但人工智能研究顾问公司SemiAnalysis的创始人迪伦‧帕特尔(Dylan Patel)估计,其库存至少有5万片。这些储备对训练人工智能具有潜力,也可以将它们与低功耗芯片(比如H800)结合使用来开发模型。
“我们面临的问题从来不是钱,而是高端芯片被禁运。”梁文锋告诉“36氪”说。
尚不清楚DeepSeek的R1模型有无使用被禁高端芯片,以及数量如何。
出口管制的争议
普渡大学克拉奇技术外交研究所(Krach Institute for Tech Diplomacy)首席执行官米歇尔‧吉达(Michelle Giuda)告诉彭博电视台,美国必须通过加强出口管制,来保持“真正强大的防御”。她补充道,与此同时,如果美国想在科技竞赛中保持领先,就需要在培养优秀工程师方面赶上中国。
“我们应该做的就是加倍努力,让美国在人工智能创新方面行动得更快、更聪明、成本更低。”她说道。
前OpenAI研究主管迈尔斯‧布伦达格(Miles Brundage)在接受自媒体ChinaTalk时说,他担心有人会将DeepSeek此事作为反对出口管制的最终叙事论点。
“虽然我不认为这个论点成立,但我理解为什么人们可能会看到它并得出结论,认为出口管制适得其反。”他说,“出口管制是有效的——你不能否认这种情况正在发生,而且由于出口管制,这种情况更有可能发生。”