斯坦福华裔科学家 50刀训练出媲美Deepseek模型
21世纪经济报道 2025-02-06 10:42+-
据《科创板日报》消息,李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。
该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini
2.0 Flash Thinking Experimental提炼出来的。
公开资料显示,李飞飞1976年生于北京的一个高级知识分子家庭,16岁时赴美求学。从2000年进入加州理工学院攻读研究生起,李飞飞一直从事人工智能研究,并于2005年获得电子工程博士学位。
据《证券时报》报道,李飞飞于2024年4月创办了World
Labs(空间智能),正式从学者转型成为一名创业者。创办仅几个月,空间智能已在7月的一轮融资中筹集到了约1亿美元资金,估值突破10亿美元,晋升为又一AI独角兽。
据澎湃新闻报道,李飞飞曾在采访中提到,现在的AI比人类差远了,能耗高、体积庞大,而且尚未具备情感,但人类智慧可以启发下一代AI做得更好。