斯坦福华裔科学家 50刀训练出媲美Deepseek模型

21世纪经济报道 2025-02-06 10:42

据《科创板日报》消息，李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。

该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。研究人员表示，s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的。

公开资料显示，李飞飞1976年生于北京的一个高级知识分子家庭，16岁时赴美求学。从2000年进入加州理工学院攻读研究生起，李飞飞一直从事人工智能研究，并于2005年获得电子工程博士学位。

她在33岁时就成为斯坦福计算机系终身教授，44岁成为美国国家工程院院士。在计算机视觉这一领域还相当冷门的早期，李飞飞就选择了这个方向并持续耕耘，创立了ImageNet——一个拥有1500万张图片的数据库，成为人工智能计算机视觉研究的奠基之作。

据《证券时报》报道，李飞飞于2024年4月创办了World Labs（空间智能），正式从学者转型成为一名创业者。创办仅几个月，空间智能已在7月的一轮融资中筹集到了约1亿美元资金，估值突破10亿美元，晋升为又一AI独角兽。

据澎湃新闻报道，李飞飞曾在采访中提到，现在的AI比人类差远了，能耗高、体积庞大，而且尚未具备情感，但人类智慧可以启发下一代AI做得更好。

实用资讯