中国的 DeepSeek AI 能否超越美国竞争对手?
拉里·贝尔 (Larry Bell) 周一 (7月21日) 在《新闻快讯》发问:中国的DeepSeek AI 能否超越美国竞争对手?
今年1月,一家名为DeepSeek的中国人工智能初创公司在华尔街掀起了一场价值1万亿美元的“血洗”,震惊了硅谷。
由于科技股占比较高的纳斯达克指数下跌3.1%,受英伟达股价暴跌16.9%的拖累,美国芯片制造商的投资者纷纷撤资。几天后,纳斯达克指数企稳,收盘上涨8.9%,至128.99美元。
DeepSeek的R1大型语言模型的训练成本远低于ChatGPT,但其实际性能却与其不相上下。
DeepSeek的创业领袖梁文峰最初在一家对冲基金公司Jacobi创立了自己的公司;他在大学毕业几年后于2023年创立了这家公司,旨在利用人工智能在金融市场上寻找盈利交易。
2015年,他与两位大学好友共同创立了另一家投资公司High-Flyer。
梁选择在科技中心杭州创办自己的企业或许并非偶然。杭州也是科技巨头阿里巴巴的总部所在地,也是众多技术人才的聚集地。
中国的工程师数量大约是美国的9倍,理工科毕业生数量可能是美国的15倍。
梁的团队于2019年开始使用Nvidia图形处理器构建计算系统。到2022年底,当OpenAI首次发布ChatGPT时,High-Flyer是少数几家拥有Nvidia高端芯片的中国公司之一。
这些用于 Nvidia 图形处理器的芯片,与美国人工智能数据中心的领先 GPU 一样,几乎全部由台湾半导体制造公司制造。
直到最近,支持对话式语言程序(例如 OpenAI 的 ChatGPT)的人工智能模型,都是在大量文本、图像和其他数据上进行训练的,应用专门的算法来寻找聊天机器人可以用来进行对话的模式。
DeepSeek 通过训练其模型,使其能够从相关领域的专家资源中搜索并集中数据搜索,找到不同主题特定问题的答案,而不是先从互联网上混杂着嘈杂评论的所有信息中进行搜索,从而显著降低了处理时间和功耗。
将问题委托给一系列公认的主题资源,可以减少对非常先进芯片的依赖,并在提出问题之前降低处理时间和功耗需求。
虽然这种捷径在生成答案时会消耗更多的时间和功耗,但利用专业专家资源所需的模型训练时间要少得多,成本也只是竞争模型的一小部分。
与此同时,随着全球人工智能发展导致先进芯片供不应求,大型科技公司纷纷向数据中心投入巨资,导致先进芯片供不应求,英伟达已不再是唯一的供应商。
亚马逊、谷歌和微软也一直在开发自主研发的芯片设计,以支持其人工智能平台;而英伟达的竞争对手英特尔和AMD也在大力推广各自的人工智能专用芯片。
近年来,美国加强了对华芯片出口限制,英伟达的应对措施是为中国市场生产性能远低于其H800的芯片,以满足华盛顿的限制要求。DeepSeek表示,他们使用其中一些芯片开发了最新的R1型号。
DeepSeek“少花钱多办事”的理念挑战了此前关于人工智能取得重大进展需要多少算力和多少支出的假设。OpenAI、甲骨文和软银最近宣布将对星际之门(Stargate)基础设施进行高达5000亿美元的合资投资,成为头条新闻。
微软计划今年在人工智能数据中心上投入 800 亿美元,Meta 首席执行官马克·扎克伯格表示,他计划今年在人工智能项目上投入约 650 亿美元,其中包括一个“规模庞大,足以覆盖曼哈顿很大一部分”的数据中心。
Meta 预计到今年年底将拥有 130 万颗先进芯片,而据报道,DeepSeek 的 R1 模型仅需 1 万颗芯片即可进行进一步开发。
埃隆·马斯克的 SpaceX 已同意向 xAI 投资 20 亿美元,这家初创公司正努力追赶 OpenAI。
今年早些时候,他将 xAI 与 X 合并,将一个小型研究实验室与他的社交媒体平台相结合,以帮助扩大 Grok 聊天机器人的影响力。
科技作家乔治·吉尔德在《华尔街日报》撰文指出,如今人工智能的关键突破并非软件,而是一个超越微芯片的新时代,即晶圆级集成,它将整个数据中心的精髓整合到一块 12 英寸的晶圆上。
美国公司 Cerebras 借助阿联酋科技公司 G42 的融资,展示了基于约四万亿个互连晶体管的“超越芯片”晶圆级计算能力。该公司原本计划进行首次公开募股 (IPO),但因中国与阿联酋之间可能存在关联而遭到美国政府的抵制。
特斯拉用于人工智能训练的 Dojo 系统应用了存储在“训练区块”上的大量视频数据,这些数据来自特斯拉汽车上的摄像头,这些摄像头通过整个晶圆互连。
Gilder 观察到,“由于 DeepSeek 和 ChatGPT 等大型语言模型使用不可靠的互联网数据,因此它们在现实世界中实现智能的可能性本质上低于特斯拉 Dojo 区块上的像素处理器。”
由荷兰人 Walter de Heer 领导的佐治亚理工学院团队在《自然》杂志上报道了另一项晶圆级突破,他们在碳化硅晶圆上覆盖了一层超薄石墨烯,其开关速度比硅快 1000 倍。
同样,正如许多人工智能进步的典型特征一样,美国国家安全的一个主要担忧围绕着德希尔此前的联系,以及他团队的中国学生与中国天津大学的联系,以及据称与中国军方的研究联系。
我们绝对不能让中国在我们自己的大学里胜过我们。