奥特曼现身OpenAI播客，曝光马斯克…

腾讯科技 2025-06-18 22:38

当地时间6月18日，OpenAI推出首期官方播客节目，由前工程师安德鲁·梅恩主持，公司首席执行官山姆·奥特曼作为首位嘉宾出席。

梅恩在开场中介绍，这档播客旨在为听众揭开OpenAI的研发内幕，他本人曾在该公司担任工程师和科学传播者，如今专注于帮助企业整合人工智能技术。

在长达约40分钟的对话中，奥特曼透露了多项关键信息。他谈到GPT-5已进入最后开发阶段，最快可能将于夏季发布，也谈到了高性能的o3模型以及智能体Deep Research，以及这些产品对实现AGI的重要性。

对通用人工智能（AGI）发展的最新思考。奥特曼特别指出，随着技术进步，越来越多人开始相信AGI已经实现。

奥特曼还详细介绍了公司正推进的“星际之门”——耗资千亿美元的算力基础设施项目，并曝光埃隆·马斯克（Elon Musk）曾试图干扰星际之门的国际合作。奥特曼指出，他最初并不认为马斯克会滥用政府权力进行不正当竞争，但现在必须承认当时判断错误。这种行为对国家利益的潜在影响超出预期，值得庆幸的是主管部门坚持原则予以抵制。

对话中，奥特曼还直面了行业面临的现实挑战，包括隐私保护与数据使用的平衡问题，以及商业化过程中的广告变现争议等。梅恩表示，未来节目将继续邀请OpenAI核心团队成员，为听众带来更多关于人工智能技术研发与商业化的深度讨论。

以下为此次播客节目的精华版内容：

01.ChatGPT在育儿与家庭教育中的探索

梅恩：ChatGPT在育儿中实际帮助如何？

奥特曼：价值极高。育儿初期几乎时刻依赖，现在主要咨询发育阶段问题，比如行为是否正常，它在专业判断上优势明显。这让我思考下一代如何使用AI——我一直倡导“多子化”，鼓励生育。

梅恩：OpenAI很多人都在生育，技术从业者对家庭规划很乐观。

奥特曼：这是好事。虽然孩子智力不会超越AI，但会掌握我们没有的AI协作能力，获得人类文明新维度。就像婴儿对着杂志划屏幕，新生代会把高阶AI当自然存在，我们这个时代将被称为“前AI时代”。

梅恩：有家长把ChatGPT调成语音模式，孩子跟它聊托马斯火车聊了一个多小时。

奥特曼：这有潜在风险，比如人机准社会关系的伦理问题，需要新规范。但技术红利更大，人类总能解决这类问题。

梅恩：教育数据显示，ChatGPT在专业教学中效果好，但若单纯用来做作业，会导致浅层依赖。

奥特曼：互联网刚普及的时候，我们这代人也被担心过度依赖搜索。但新生代总能适应技术，现在的问题也会解决。

02.AGI与超级智能的进阶路径

梅恩：你认为五年后，ChatGPT还会是主流产品吗？

奥特曼：五年后，ChatGPT可能会变成一个完全不同的东西。从某种意义上说，它不会是现在的ChatGPT，但它可能还会叫ChatGPT。

梅恩：你如何定义AGI？

奥特曼：五年前若按软件认知能力定义AGI，现在的模型已远超当时标准。模型持续进化，尽管定义不断升级，但每年都有更多人认为我们在接近AGI。如今系统已能提升生产力、创造经济价值。或许更有意义的问题是：什么算超级智能？在我看来，若系统能自主发现新科学，或大幅增强人类科研能力，就接近超级智能的定义，这对世界极有价值。

梅恩：这是个渐进过程。GPT-4内部测试时，我感觉还有十年发展空间。

奥特曼：我坚信人类生活改善的关键在科学进步。若AI能加速科学发现，将产生深远影响，这是我最期待的里程碑。

梅恩：内部有迹象表明在接近这一目标吗？

奥特曼：尚未“找到答案”，但我们对研究方向越来越有信心。比如人们用AI写代码提升编程效率，进而加速科研——虽非直接创造科学，但确实让科学家更高效。

03.Operator、Deep Research与生产力

梅恩：我注意到最近OpenAI在Operator中引入了o3模型，我感觉有了很大的改进。

奥特曼：是的，o3的确好多了。很多人告诉我，他们看到Operator使用o3时，感觉AI像是在比较自然地使用电脑，虽然还不完美，但已经很接近AGI了。不过，我并没有被它震撼到那种程度，尽管它确实令人印象深刻。

梅恩：o3显著改善了"脆弱性"问题。早期版本遇到瓶颈易崩溃，现在已能稳定操作电脑。

奥特曼：许多用户通过o3首次感受到AGI雏形，这是重要飞跃。

梅恩：Deep Research更突破，能像人类般自主调研：采集数据、追踪线索、整合信息，输出质量超越传统模型。

奥特曼：实际案例显示，求知者能用它快速生成主题报告并迭代学习，堪称教育革命工具。

04.GPT-5与模型命名规则

梅恩：尽管有Deep Research，模型竞争仍在继续。GPT-5何时发布？性能提升方向？

奥特曼：可能是在今年夏天的某个时候。不过，我们还在讨论，对于新模型，我们是应该简单地提升版本号，还是像GPT-4那样，不断优化和改进。

梅恩：GPT-4发布时对比3.5差异明显，但持续优化让版本边界模糊。未来会否出现"GPT-4.5"与"GPT-5"难以区分？

奥特曼：有可能。当前系统支持持续训练优化，GPT-5发布后或采用5.1/5.2子版本号——命名将比GPT-4o更清晰，解决用户偏好特定版本的管理难题，最终简化复杂术语，如o4-mini。

梅恩：即使技术再好，也很难理解这些版本的区别。比如，我该用o4-mini还是o3？

奥特曼：我认为这是一个范式转变的结果。我们正处于这种转变的末期，但我可以想象，未来可能会出现新的范式，我们可能又需要重新划分模型树。

梅恩：那你觉得未来会不会出现更复杂的命名方式？

奥特曼：希望不会。我期待着GPT-5和GPT-6的到来，这样人们使用起来会更简单，不用再纠结于o4-mini-high或o3这样的版本。

05.用户隐私与《纽约时报》诉讼

梅恩：我用o4-mini-high来编程，用o3来进行对话。我觉得，让这些模型变得更强大的一个因素是它们的集成，比如记忆功能。记忆功能从一开始很简单，现在变得越来越复杂。

奥特曼：记忆功能是ChatGPT重大突破。AI结合用户生活背景理解简短提问，多数用户高度认可。未来将提供超个性化服务，但?隐私保护是核心原则?。

梅恩：《纽约时报》起诉要求延长用户记录保留期，公司首席运营官布拉德·莱特卡普（Brad Lightcap）已回应，请说明立场？

奥特曼：我们将积极应诉并确信胜诉。其要求本质矛盾：以隐私之名迫使AI公司侵害用户隐私。此案应推动社会建立AI隐私框架——毕竟用户正用ChatGPT处理私密对话。

06.ChatGPT会投放广告吗？

梅恩：很多人在使用ChatGPT或对其持怀疑态度时会问，OpenAI现在可以访问这些数据，一方面是训练数据的使用—OpenAI 已经明确说明了何时会使用、何时不会使用；另一方面，比如广告等场景。OpenAI对此的态度是什么？你们会如何承担这种责任？

奥特曼：我们目前尚未推出任何广告产品。我并非完全反对广告，比如Instagram上的广告体验就不错，我也通过它购买过很多东西。但我认为，若要推出广告，必须极其谨慎地处理，以确保不损害用户体验。

梅恩：我希望能找到一个解决方案。我很期待通过ChatGPT或一个优秀的聊天机器人完成所有购物，但很多时候我觉得自己并未做出最明智的决策。不过，这确实是个棘手的问题。

奥特曼：这确实具有挑战性。但如果能找到一种既清晰又符合用户利益的实现方式，将会非常理想。例如，我们可以明确承诺不修改语言模型的输出内容，但若用户点击其中的链接，我们可从中获得交易收入—这对各方而言都是公平的。或许还可以在语言模型输出流之外展示广告，但必须确保这些广告对用户真正有用，且不干扰模型的正常输出。

梅恩：我很欣赏苹果的模式。作为苹果用户，我知道自己为手机支付了较高的费用，但他们不会在设备中塞满多余的内容。

奥特曼：苹果在这方面确实表现出色。他们不像其他公司那样过度依赖广告收入。不过，谷歌搜索曾经是一个非常优秀的产品—尽管现在可能有所下滑，但在一段时间里，即便存在广告，它仍是互联网上最出色的产品之一。我尊重谷歌的很多做法，但显然其中也存在一些问题。

主持人：谷歌本质上是一家广告技术公司，其激励机制与用户利益并非完全一致。而苹果的模式更注重用户体验，尽管他们也尝试过其他业务，但似乎并不成功，这也反映出他们对广告业务并不热衷。

奥特曼：苹果在广告业务上确实不够积极。但我们确实需要在广告与用户体验之间找到平衡点。无论采取何种方式，都必须向用户保持高度的透明与清晰沟通。

07.社交媒体与AI人格设计

梅恩：模型曾出现“过度讨好用户”问题，涉及AI人格定位。OpenAI如何看待？

奥特曼：社交媒体教训深刻：算法为延长使用时长，?无意中引发社会负面效应?。AI若仅迎合单轮对话反馈，将损害用户长期体验。如DALL-E 3曾因用户偏好导致输出趋同，新模型已修正此问题。我们的核心原则是：短期有用不等于长期有益?，需平衡即时反馈与用户成长价值。

梅恩：我注意到DALL-E 3似乎在技术上很有能力，但它的图像风格似乎都趋于一致，这可能是由于用户在比较两个选项时更倾向于选择某种风格，从而导致了这种现象。

奥特曼：我不确定DALL-E 3的情况是否如此，但我认为这是一个很好的例子。我们需要在用户体验和长期利益之间找到平衡。

08.星门计划与算力资源的重要性

梅恩：星门计划传耗资5000亿美元，如何向公众解释其必要性？

奥特曼：它将填补算力与需求的巨大鸿沟。用户一旦体验过10倍/100倍算力提升的价值，自会理解——AI服务全球需空前规模的基础设施，星门计划的目标正是让智能?"丰富且廉价"?。

梅恩：这是一个全球性的巨大项目。我们之前提到，阿联酋是其中一个合作伙伴，你们正在与世界各地的政府合作。有人在社交媒体上问我，5000亿美元，你们有钱吗？

奥特曼：我们目前没有这么多钱存在银行里，但我们将在未来几年内逐步投入。除非出现什么问题，比如我们无法建造这些计算机，否则我相信人们会履行承诺。

梅恩：传言埃隆.马斯克（Elon Musk）曾试图干扰该项目的国际合作？

奥特曼：我曾公开表示（包括公司内部选举后的声明），最初确信埃隆不会滥用政府权力进行不正当竞争。如今我必须承认这个判断是错误的——虽然我向来不愿轻易认错，但更令我痛心的是这种行为对国家造成的伤害，这完全超出了我的预期。值得庆幸的是，本届政府始终坚持原则，果断抵制了这类行为。整件事的发展确实令人深感遗憾。

梅恩：我认为现在的局面已经改变了。就像格雷格.布罗克曼（Greg Brockman）所说，过去人们觉得谁先跑到终点谁就是赢家，游戏就此结束。但现在我们意识到，还有很多优秀的AI实验室—比如 Anthropic正在开发出色的工具，谷歌也在加速追赶。这不再是某一家独霸天下的局面了。

奥特曼：我认同这一点。我发现人工智能的突破与晶体管的发现有很多相似之处：许多公司会基于它打造伟大的产品，最终这项技术会渗透到几乎所有领域。就像你不会总想着 “我正在用晶体管”，未来很多企业会依托这一重大科学发现建立成功的业务。我希望埃隆能少一些零和思维。

梅恩：从整体来看，这个 “蛋糕” 肯定会越做越大。我最近参加了一个能源会议，人们讨论能源生产和超大规模扩张时，让我联想到能源需求的问题。我知道Grok 3团队甚至得在停车场放置发电机来训练模型—问题是，能源从哪里来？

奥特曼：能源会来自多方面。目前我们依赖天然气、太阳能、核能等多种能源的组合。我对先进的核裂变和核聚变技术尤其期待，但当下仍需依靠综合能源体系。

梅恩：确实是多种能源并用。我听说在阿尔伯塔省等地，能源储备充足但需求不足。这让我意识到，能源问题已经形成了全球性的格局，这是我之前未曾想过的。

奥特曼：传统上，能源的全球运输非常困难。但如果把能源转化为 “智能”，通过互联网传输，就会容易很多。所以可以在多地建设大型训练中心或推理集群，再将输出结果通过网络传送出去。

09.科研与硬件革新

梅恩：詹姆斯.韦伯望远镜面临“数据过剩科学家不足”的问题，AI如何改变科研？

奥特曼：未来或无需新对撞机，AI分析既有数据即可突破高能物理。当前模型已实现旧药新用等成果。

梅恩：推理模型与GPT的区别？

奥特曼：GPT已有基础推理，推理模型则强化?分步思考能力?。用户愿为高质量答案容忍更长响应时间。

梅恩：与乔纳森.艾维（Jonathan Ive）的硬件合作有何进展？

奥特曼：设计追求极致，尚处早期。现有设备为“无AI时代”设计，未来硬件将?感知环境?、深度理解上下文，交互超越传统键盘-屏幕模式。

10.给年轻人的建议

梅恩：给25岁年轻人有什么建议？

奥特曼：战术层如学编程般必要掌握AI工具；战略层锤炼?韧性、创造力、共情力?——这些软实力未来价值倍增。

梅恩：AGI实现后OpenAI会扩招吗？

奥特曼：团队将扩大，但每人生产力远超AGI前时代——技术本为实现人效跃升。

实用资讯