马斯克翻车了

新行情 2025-02-20 13:38+-

马斯克发布Grok 3大模型

马斯克的AI产品终于来了。

日前,全球科技界迎来了一场备受瞩目的盛事,马斯克旗下的人工智能公司xAI,正式发布了其最新一代大模型Grok 3。在发布会上,马斯克毫不吝啬地赞誉Grok 3为“地球上最聪明的人工智能”。

Grok系列模型自2023年11月推出以来,便以其强大的性能和不断迭代升级的能力,在人工智能领域崭露头角。此次发布的Grok 3,更是被视为xAI公司对全球AI市场的一次重大冲击。

据马斯克介绍,Grok 3的计算量比前代产品Grok 2高出10倍,其训练依托于xAI最新搭建的Colossus超级计算机,该计算机搭载了10万颗英伟达H100 GPU,提供了超过2亿GPU小时的计算资源。

Grok 3最大的技术亮点在于其引入了“思维链”(Chain Of Thought)推理机制。这一机制允许Grok 3像人类一样分步骤解决复杂问题,显著提高了模型处理复杂查询和提供更连贯、更有逻辑响应的能力。

在一系列演示中,马斯克和他的团队展示了Grok 3在解决物理题、创作游戏以及进行图像分析和3D动画生成等方面的卓越表现。

在Grok 3发布之前,全球AI市场已经涌现出了一批优秀的大模型,如OpenAI的GPT-4o、Anthropic的Claude 3.5 Sonnet以及中国AI初创公司杭州深度求索人工智能基础技术研究有限公司发布的DeepSeek-V3等。

xAI团队展示了Grok 3与部分大模型的比赛结果。其中,xAI称,Grok 3在AIME、GPQA和LCB的基准测试中胜过GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3、Gemini-2 Pro等模型。

马斯克翻车了

图源:马斯克Grok3模型新品发布会

马斯克翻车了

图源:马斯克Grok3模型新品发布会

使用更多测试时间计算时,Grok 3 Reasoning和Grok 3 mini Reasoning的表现超过了高配版o3 mini、o1和DeepSeek-R1等其他模型。

对于马斯克的Grok 3大模型,OpenAI联合创始人、前特斯拉AI总监、知名计算机科学家李飞飞的爱徒安德烈·卡帕西(Andrej Karpathy)评论:“Grok-3+Thinking感觉与OpenAI最强大的模型o1-pro相当,略好于DeepSeek-R1和Gemini 2.0 Flash Thinking。”

Grok 3大模型“翻车了”

马斯克的“地表最强”模型翻车了。

尽管马斯克对Grok 3充满了信心,并赞誉其为“地球上最聪明的人工智能”,但在发布后不久,Grok 3就遭遇了一次尴尬的翻车事件。

有人测试了最新的Beta版Grok3,当被问及经典问题“9.11与9.9哪个大?”时,Grok 3竟然无法给出正确的答案。

马斯克翻车了

图源:新浪网

对于马斯克的Grok 3模型翻车,有网友表示,这暴露了Grok 3在基本理解能力方面的不足,也有网友称,这可能是模型在训练过程中出现的偶然失误,并不能完全代表Grok 3的真实水平。

据了解,9.11与9.9哪个大?这个问题曾难倒众多大模型,“独角兽”Scale AI公司的专家曾发文,他将(9.11 and 9.9 - which is bigger?)为Prompt输入给各主流大模型。

结果ChatGPT 4o 的输出是9.11 比 9.9 大;Gemini Advanced同样翻车,输出结果是9.11>9.9;Claude 3.5 Sonnet在该问题上同样踩坑。

马斯克翻车了

图源:新浪网

对于这种现象,谷歌的工程师曾表示,数学奥林匹克竞赛对人工智能来说更容易,但常识仍然很难。

值得一提的是,对于同样的问题,国产大模型则能够轻松应对。例如,询问DeepSeek,立马得出答案9.9大于9.11,百度文心一言同样轻松解决。

马斯克翻车了

图源:DeepSeek模型

一些基础性的常识问题看似简单,实则考验了模型对数字大小和比较的基本理解能力。对于人类来说,这是一个不言而喻的问题,但对于人工智能模型来说,却可能成为一个难以逾越的障碍。

由此可见,人工智能技术的发展近年来虽然非常迅速,但仍然存在许多需要改进和完善的地方。人工智能完全替代人脑,并不是一件容易事。

马斯克是“天才”也是“疯子”

马斯克,是当今世界最受瞩目的科技明星。

他1971年6月出生于南非,自幼便对科学技术展现出了浓厚的兴趣和非凡的天赋。从10岁开始学习编程,到13岁开发出自己的第一款游戏并赚到人生第一桶金,马斯克的创业之路注定不平凡。

马斯克翻车了

马斯克年轻时照片 图源:抖音

经过几十年的不懈奋斗,马斯克已经成功打造了一个庞大的商业帝国。

他是特斯拉公司的创始人,也是SpaceX首席执行官兼首席技术官,SolarCity董事会主席、Twitter首席执行官 ,Neuralink创始人 、OpenAI联合创始人......

2021年3月2日,胡润研究院发布《2021胡润全球富豪榜》,马斯克以1.28万亿元人民币财富首次成为世界首富;10月,马斯克成为历史上首位身价破3000亿美元的人,是福布斯统计史上最富有的人。

彭博亿万富翁指数显示,截至去年12月中旬,马斯克的个人净资产已经达到了4550亿美元,是史上首个突破4000亿美元大关的富豪。

坐拥亿万财富,马斯克却将所有心思用在实现“火星”梦上。

马斯克的太空运输公司SpaceX打造了大型可重复使用火箭“星舰”,该火箭被设计为能够降落在任何具备着陆条件的地方,包括地球表面、月球表面甚至火星表面。

“星舰”的成功发射为SpaceX的未来商业航天计划奠定了坚实基础,也为人类探索太空提供了新的可能。

马斯克翻车了

星舰发射 图源抖音

去年年初,马斯克曾公开表示:“你知道我想象中八年后会是什么样子么?我希望我们能够降落在火星上,我希望我们能够将人送上月球,如果幸运的话,我希望我们能够在八年内将人送上火星。”

马斯克翻车了

马斯克的设想是这样的:“星舰来来往往,我们有一个美丽的火星城市,打造了一个繁荣的火星文明。我们最终会将火星改造成一颗类似于地球的行星,我们可以将地球上的生命带到火星,让地球生命在火星上延续。”

未来,马斯克还会有怎样的设想,我们拭目以待。

  • 最新评论
  • jianlj56

    我刚在deep seek 上问了8.22 比 8.9 大。 8.22 比 8.9 大 具体比较如下: 8.22 可以理解为 8 + 0.22 8.9 可以理解为 8 + 0.90 显然,0.90 大于 0.22,因此 8.9 大于 8.22。不过,如果这里的 8.22 和 8.9 是版本号或其他特定含义,可能需要根据具体上下文来判断。在纯数字比较下,8.9 更大。 前后矛盾

    屏蔽
  • katerina

    刚刚在grk 3 上测试了一下它给出的是正确的答案

    屏蔽
  • 侠客独行

    我用deep seeK,随便问它,64 比911 大吗,吖马上提示“ 中國共產黨和中國政府始終堅持…..” deep seek 人工智障,宇宙第一

    屏蔽
  • 破棉袄

    胡扯淡嘛,我刚在Grok 3上试验过,得到正确答案了:Which one is the bigger number in 9.11 and 9.9? To determine which number is larger between 9.11 and 9.9, let’s compare them step by step. Both numbers have the same integer part: 9. Therefore, the comparison depends on the fractional parts: The fractional part of 9.11 is 0.11. The fractional part of 9.9 is 0.9. Since 9.11 has two decimal places and 9.9 has one, align the decimal places by writing 9.9 as 9.90 (adding a trailing zero doesn’t change its value). Now compare: 9.11 9.90 Integer part: Both are 9, so they’re equal here. First decimal place: 9.11 has a 1, while 9.90 has a 9. Since 1 < 9, we can conclude the comparison. Thus, 9.11 < 9.90, and since 9.90 is the same as 9.9, it follows that 9.9 is greater than 9.11. Alternatively, consider their values: 9.11 = 9 + 0.11 = 9 + 11/100. 9.9 = 9 + 0.9 = 9 + 9/10 = 9 + 90/100 (converting to a common denominator). Since 90/100 > 11/100, it’s clear that 9.9 > 9.11. So, the larger number is 9.9.

    屏蔽
4