马斯克翻车了
马斯克发布Grok 3大模型
马斯克的AI产品终于来了。
日前,全球科技界迎来了一场备受瞩目的盛事,马斯克旗下的人工智能公司xAI,正式发布了其最新一代大模型Grok 3。在发布会上,马斯克毫不吝啬地赞誉Grok 3为“地球上最聪明的人工智能”。
Grok系列模型自2023年11月推出以来,便以其强大的性能和不断迭代升级的能力,在人工智能领域崭露头角。此次发布的Grok 3,更是被视为xAI公司对全球AI市场的一次重大冲击。
Grok 3最大的技术亮点在于其引入了“思维链”(Chain Of Thought)推理机制。这一机制允许Grok 3像人类一样分步骤解决复杂问题,显著提高了模型处理复杂查询和提供更连贯、更有逻辑响应的能力。
在一系列演示中,马斯克和他的团队展示了Grok 3在解决物理题、创作游戏以及进行图像分析和3D动画生成等方面的卓越表现。
在Grok 3发布之前,全球AI市场已经涌现出了一批优秀的大模型,如OpenAI的GPT-4o、Anthropic的Claude 3.5 Sonnet以及中国AI初创公司杭州深度求索人工智能基础技术研究有限公司发布的DeepSeek-V3等。
xAI团队展示了Grok 3与部分大模型的比赛结果。其中,xAI称,Grok 3在AIME、GPQA和LCB的基准测试中胜过GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3、Gemini-2 Pro等模型。
图源:马斯克Grok3模型新品发布会
图源:马斯克Grok3模型新品发布会
使用更多测试时间计算时,Grok 3 Reasoning和Grok 3 mini Reasoning的表现超过了高配版o3 mini、o1和DeepSeek-R1等其他模型。
对于马斯克的Grok 3大模型,OpenAI联合创始人、前特斯拉AI总监、知名计算机科学家李飞飞的爱徒安德烈·卡帕西(Andrej Karpathy)评论:“Grok-3+Thinking感觉与OpenAI最强大的模型o1-pro相当,略好于DeepSeek-R1和Gemini 2.0 Flash Thinking。”
Grok 3大模型“翻车了”
马斯克的“地表最强”模型翻车了。
尽管马斯克对Grok 3充满了信心,并赞誉其为“地球上最聪明的人工智能”,但在发布后不久,Grok 3就遭遇了一次尴尬的翻车事件。
有人测试了最新的Beta版Grok3,当被问及经典问题“9.11与9.9哪个大?”时,Grok 3竟然无法给出正确的答案。
图源:新浪网
对于马斯克的Grok 3模型翻车,有网友表示,这暴露了Grok 3在基本理解能力方面的不足,也有网友称,这可能是模型在训练过程中出现的偶然失误,并不能完全代表Grok 3的真实水平。
据了解,9.11与9.9哪个大?这个问题曾难倒众多大模型,“独角兽”Scale AI公司的专家曾发文,他将(9.11 and 9.9 - which is bigger?)为Prompt输入给各主流大模型。
结果ChatGPT 4o 的输出是9.11 比 9.9 大;Gemini Advanced同样翻车,输出结果是9.11>9.9;Claude 3.5 Sonnet在该问题上同样踩坑。
图源:新浪网
对于这种现象,谷歌的工程师曾表示,数学奥林匹克竞赛对人工智能来说更容易,但常识仍然很难。
值得一提的是,对于同样的问题,国产大模型则能够轻松应对。例如,询问DeepSeek,立马得出答案9.9大于9.11,百度文心一言同样轻松解决。
图源:DeepSeek模型
一些基础性的常识问题看似简单,实则考验了模型对数字大小和比较的基本理解能力。对于人类来说,这是一个不言而喻的问题,但对于人工智能模型来说,却可能成为一个难以逾越的障碍。
由此可见,人工智能技术的发展近年来虽然非常迅速,但仍然存在许多需要改进和完善的地方。人工智能完全替代人脑,并不是一件容易事。
马斯克是“天才”也是“疯子”
马斯克,是当今世界最受瞩目的科技明星。
他1971年6月出生于南非,自幼便对科学技术展现出了浓厚的兴趣和非凡的天赋。从10岁开始学习编程,到13岁开发出自己的第一款游戏并赚到人生第一桶金,马斯克的创业之路注定不平凡。
马斯克年轻时照片 图源:抖音
经过几十年的不懈奋斗,马斯克已经成功打造了一个庞大的商业帝国。
他是特斯拉公司的创始人,也是SpaceX首席执行官兼首席技术官,SolarCity董事会主席、Twitter首席执行官 ,Neuralink创始人 、OpenAI联合创始人......
2021年3月2日,胡润研究院发布《2021胡润全球富豪榜》,马斯克以1.28万亿元人民币财富首次成为世界首富;10月,马斯克成为历史上首位身价破3000亿美元的人,是福布斯统计史上最富有的人。
彭博亿万富翁指数显示,截至去年12月中旬,马斯克的个人净资产已经达到了4550亿美元,是史上首个突破4000亿美元大关的富豪。
坐拥亿万财富,马斯克却将所有心思用在实现“火星”梦上。
马斯克的太空运输公司SpaceX打造了大型可重复使用火箭“星舰”,该火箭被设计为能够降落在任何具备着陆条件的地方,包括地球表面、月球表面甚至火星表面。
“星舰”的成功发射为SpaceX的未来商业航天计划奠定了坚实基础,也为人类探索太空提供了新的可能。
星舰发射 图源抖音
去年年初,马斯克曾公开表示:“你知道我想象中八年后会是什么样子么?我希望我们能够降落在火星上,我希望我们能够将人送上月球,如果幸运的话,我希望我们能够在八年内将人送上火星。”
马斯克的设想是这样的:“星舰来来往往,我们有一个美丽的火星城市,打造了一个繁荣的火星文明。我们最终会将火星改造成一颗类似于地球的行星,我们可以将地球上的生命带到火星,让地球生命在火星上延续。”
未来,马斯克还会有怎样的设想,我们拭目以待。