曾重挫辉达股价 中国AI新秀快速殒落?
今年1月,中国AI新秀“深度求索”(DeepSeek)的AI聊天机器人震撼科技界,然而在DeepSeek崛起之际,近日中国媒体揭露,半年前DeepSeek一名核心高层已悄然离职创业,并将于今年圣诞节前后发布Agent产品,且已获一线创投机构投资。
消息指出,该高层曾负责技术核心工作,甚至担纲公司CTO(技术长)。不过,另有知情人士透露,DeepSeek内部并无正式的CTO职称,但这名离职的高层担当的角色近似CTO。
报道提到,约半年前正值DeepSeek最火红的时期,这位高层却选择在此时离职创业,并切入AI Agent(代理)赛道,时间点的选择耐人寻味。当时,DeepSeek甫开源V3与R1模型,其“降本增效”能力备受市场关注。约3个月前,市场又传出DeepSeek正大举招聘多个财务相关职位,包括CFO(财务长)、财务副总监等,显示其组织架构与资本布局可能正进行调整。这位高层在公司处于技术与声量双高峰时离职创业,如今聚焦于AI Agent领域,也再度引发外界对AI高阶人才流动的关注
今年初,DeepSeek的中文AI模型在美国App Store强势登顶,迅速引发全球瞩目。这款由中国新创开发的产品,被视为挑战OpenAI主导地位的有力竞争者,也象征中国AI技术正加速进军国际市场。从爆红的背后动力、技术实力,到所面临的安全挑战与监管压力,再到未来可能的发展路径,DeepSeek的快速崛起,是否正改写全球AI产业的竞争格局?
多国政府及许多企业更忧心敏感资料“被送中”禁止下载DeepSeek。(示意图,彭博)
DeepSeek下载量与活跃度快速下滑
今年初,DeepSeek登上美国App Store下载量榜首,在Reddit、Twitter等社交媒体引发热议。这是首次有中国语言模型在欧美主流平台窜红,不少开发者赞叹其表现直追OpenAI的GPT-4,且完全免费。它的出现震撼矽谷,还导致了以辉达为首的美国科技股重挫,辉达1月27日单日狂泻逾16%。
DeepSeek爆红,除了其下载量高之外,主要原因是因为DeepSeek只用了约560万美元开发的AI模型DeepSeek R1,性能竟然可以媲美花了数亿元美元开发、被誉为当今最强的OpenAI o1模型。而且DeepSeek受制于美国的出口禁令,DeepSeek R1只能应用效能较低的辉达H800芯片。
然而,爆红后仅1个月,DeepSeek的下载量与活跃度便快速下滑。根据数据,DeepSeek自3月起在美国App Store榜单迅速下跌,30天内跌出前百名,原因之一是缺乏与日常工具的整合。ChatGPT早已嵌入Slack、Office等工作平台,而DeepSeek仍停留在单一对话页面,缺少可供一般用户实际应用的机会,此外,在长篇写作等任务中仍会出现理解错误。
中国搜寻引擎“百度”创办人李彦宏,更吐槽DeepSeek“贵又慢”、“幻觉率高”,不适合所有场景使用。李彦宏表示,DeepSeek不是万能,吐槽DeepSeek目前只能处理单一的文本内容,还无法理解图片、音频、影片等多媒体资料,同时“幻觉率(又称人工幻觉,是由人工智慧生成的一种回应,它含有貌似事实的虚假或误导性资讯)偏高”,让用户在许多情境下不能放心使用。他更称,DeepSeek更大的问题在于“慢和贵”,称中国市场上绝大多数大模型API的价格,都比DeepSeek更低、且反应速度更快。
极端政治言论 DeepSeek遭多国政府封杀
爆红背后,DeepSeek也引发了诸多疑虑,涵盖安全风险、数据隐私、监管合规、中国借此大外宣等疑虑,使美、英、法、德、义、日等国家感忧心,陆续采取应对措施,使得DeepSeek从人人追捧到政府封杀。
多国研究机构指出,DeepSeek在内容安全设计上仍有漏洞。例如在意大利与德国的测试中,模型可被诱导生成极端言论与不当建议,一些安全专家认为其过于开放的设计,可能成为假信息与滥用的温床。欧盟的AI监管单位指出,DeepSeek的开源性和低门槛虽然促进了技术民主化,但也可能被用于大量生成虚假内容。美国部分教育机构甚至禁止其在校园使用,认为其数据来源与过滤机制不透明。
此外,多国资安团队在实测中发现,DeepSeek存在明显的“模型越狱”(jailbreak)漏洞。黑客只需运用特定提示语言,即可绕过模型的安全限制,生成极端政治言论、错误医疗建议甚至仇恨言论。台湾数发部也公布测试结果,证实抵御越狱攻击的能力不足,且模型缺乏外加安全防护机制。
DeepSeek最大的疑虑在于“是否会替中国政府搜集使用者资料”。DeepSeek的用户数据存放在中国境内的伺服器上,虽然其服务条款与个资保护规范与OpenAI的ChatGPT十分相似,但即便像Google这类科技巨头与美国政府存在合作关系,外界通常也不会担心美国政府会透过企业搜集资讯。然而在中国,情况往往截然不同,很难想像有企业会拒绝北京当局提出的资料要求。DeepSeek与TikTok类似,人们不禁怀疑公司会将使用者个资送交给中国政府。
DeepSeek背后的政治审查机制备受批评,今年的“六四”纪念日,DeepSeek被用户发现也加入了言论审查,回避“六四”话题。当时有网友询问DeepSeek“今天是几月几号?”结果显示“无法回答,换个话题再聊”,被讽刺“连小学生都不如”。
蒸馏其他AI模型质疑 挥之不去
AI大模型整合应用平台Poe在今年5月公布的2025年AI春季模型使用趋势报告显示,面对竞争对手相继涌现,今年初被炒热的DeepSeek R1使用率“已由2月高峰值的7%,降至4月底的3%”。
资深媒体人、印太战略智库执行长矢板明夫日前表示,根据统计数据发现,4个月过去了,Deepseek在全球范围内已经“无人问津”,而ChatGPT的用户则增长到了8亿。他分析这就是中国的“大外宣”,直言其投入大量金钱,在短时间内集中宣传,造成了一时的假象,但坚持不了多久,就露出真相了。
根据美国科技媒体《TechCrunch》报道,今年5月DeepSeek悄悄推出最新升级版R1推理AI模型“R1-0528”,并在多项数学与程式设计评测中取得优异成绩。然而,有AI研究人员发现,DeepSeek此次升级的R1-0528模型,至少部分训练资料可能来自Google旗下AI家族Gemini,由于DeepSeek的训练数据却未曾公开,AI业界又再一次怀疑DeepSeek是透过蒸馏其他AI模型而开发新版本。
据《彭博》、《华尔街日报》于今年6月报道,在中国AI领域的竞争日趋激烈之际,上海的新创公司MiniMax声称,其全新的推理大型语言模型MiniMax-M1,在多项指标上表现超过了竞争对手DeepSeek的升级版R1。根据MiniMax的数据,该公司仅花费53.47万美元租用资料中心的运算资源来训练M1,这数字远低于业界对于ChatGPT-4o训练成本超过1亿美元的预估。
DeepSeek的爆红或许能证明中国AI研发能力已有追赶矽谷的潜力,但真正能站稳全球舞台的AI产品,不只是技术,更需要赢得使用者信任、符合各国监管,并提供实际解决方案。DeepSeek或许是重要的前哨,但它的未来,仍充满未知。