奥特曼现身OpenAI播客,曝光马斯克…
当地时间6月18日,OpenAI推出首期官方播客节目,由前工程师安德鲁·梅恩主持,公司首席执行官山姆·奥特曼作为首位嘉宾出席。
梅恩在开场中介绍,这档播客旨在为听众揭开OpenAI的研发内幕,他本人曾在该公司担任工程师和科学传播者,如今专注于帮助企业整合人工智能技术。
在长达约40分钟的对话中,奥特曼透露了多项关键信息。他谈到GPT-5已进入最后开发阶段,最快可能将于夏季发布,也谈到了高性能的o3模型以及智能体Deep
Research,以及这些产品对实现AGI的重要性。
奥特曼还详细介绍了公司正推进的“星际之门”——耗资千亿美元的算力基础设施项目,并曝光埃隆·马斯克(Elon
Musk)曾试图干扰星际之门的国际合作。奥特曼指出,他最初并不认为马斯克会滥用政府权力进行不正当竞争,但现在必须承认当时判断错误。这种行为对国家利益的潜在影响超出预期,值得庆幸的是主管部门坚持原则予以抵制。
对话中,奥特曼还直面了行业面临的现实挑战,包括隐私保护与数据使用的平衡问题,以及商业化过程中的广告变现争议等。梅恩表示,未来节目将继续邀请OpenAI核心团队成员,为听众带来更多关于人工智能技术研发与商业化的深度讨论。
以下为此次播客节目的精华版内容:
01.ChatGPT在育儿与家庭教育中的探索
梅恩:ChatGPT在育儿中实际帮助如何?
奥特曼:价值极高。育儿初期几乎时刻依赖,现在主要咨询发育阶段问题,比如行为是否正常,它在专业判断上优势明显。这让我思考下一代如何使用AI——我一直倡导“多子化”,鼓励生育。
梅恩:OpenAI很多人都在生育,技术从业者对家庭规划很乐观。
奥特曼:这是好事。虽然孩子智力不会超越AI,但会掌握我们没有的AI协作能力,获得人类文明新维度。就像婴儿对着杂志划屏幕,新生代会把高阶AI当自然存在,我们这个时代将被称为“前AI时代”。
梅恩:有家长把ChatGPT调成语音模式,孩子跟它聊托马斯火车聊了一个多小时。
奥特曼:这有潜在风险,比如人机准社会关系的伦理问题,需要新规范。但技术红利更大,人类总能解决这类问题。
梅恩:教育数据显示,ChatGPT在专业教学中效果好,但若单纯用来做作业,会导致浅层依赖。
奥特曼:互联网刚普及的时候,我们这代人也被担心过度依赖搜索。但新生代总能适应技术,现在的问题也会解决。
02.AGI与超级智能的进阶路径
梅恩:你认为五年后,ChatGPT还会是主流产品吗?
奥特曼:五年后,ChatGPT可能会变成一个完全不同的东西。从某种意义上说,它不会是现在的ChatGPT,但它可能还会叫ChatGPT。
梅恩:你如何定义AGI?
奥特曼:五年前若按软件认知能力定义AGI,现在的模型已远超当时标准。模型持续进化,尽管定义不断升级,但每年都有更多人认为我们在接近AGI。如今系统已能提升生产力、创造经济价值。或许更有意义的问题是:什么算超级智能?在我看来,若系统能自主发现新科学,或大幅增强人类科研能力,就接近超级智能的定义,这对世界极有价值。
梅恩:这是个渐进过程。GPT-4内部测试时,我感觉还有十年发展空间。
奥特曼:我坚信人类生活改善的关键在科学进步。若AI能加速科学发现,将产生深远影响,这是我最期待的里程碑。
梅恩:内部有迹象表明在接近这一目标吗?
奥特曼:尚未“找到答案”,但我们对研究方向越来越有信心。比如人们用AI写代码提升编程效率,进而加速科研——虽非直接创造科学,但确实让科学家更高效。
03.Operator、Deep Research与生产力
梅恩:我注意到最近OpenAI在Operator中引入了o3模型,我感觉有了很大的改进。
奥特曼:是的,o3的确好多了。很多人告诉我,他们看到Operator使用o3时,感觉AI像是在比较自然地使用电脑,虽然还不完美,但已经很接近AGI了。不过,我并没有被它震撼到那种程度,尽管它确实令人印象深刻。
梅恩:o3显著改善了"脆弱性"问题。早期版本遇到瓶颈易崩溃,现在已能稳定操作电脑。
奥特曼:许多用户通过o3首次感受到AGI雏形,这是重要飞跃。
梅恩:Deep Research更突破,能像人类般自主调研:采集数据、追踪线索、整合信息,输出质量超越传统模型。
奥特曼:实际案例显示,求知者能用它快速生成主题报告并迭代学习,堪称教育革命工具。
04.GPT-5与模型命名规则
梅恩:尽管有Deep Research,模型竞争仍在继续。GPT-5何时发布?性能提升方向?
奥特曼:可能是在今年夏天的某个时候。不过,我们还在讨论,对于新模型,我们是应该简单地提升版本号,还是像GPT-4那样,不断优化和改进。
梅恩:GPT-4发布时对比3.5差异明显,但持续优化让版本边界模糊。未来会否出现"GPT-4.5"与"GPT-5"难以区分?
奥特曼:有可能。当前系统支持持续训练优化,GPT-5发布后或采用5.1/5.2子版本号——命名将比GPT-4o更清晰,解决用户偏好特定版本的管理难题,最终简化复杂术语,如o4-mini。
梅恩:即使技术再好,也很难理解这些版本的区别。比如,我该用o4-mini还是o3?
奥特曼:我认为这是一个范式转变的结果。我们正处于这种转变的末期,但我可以想象,未来可能会出现新的范式,我们可能又需要重新划分模型树。
梅恩:那你觉得未来会不会出现更复杂的命名方式?
奥特曼:希望不会。我期待着GPT-5和GPT-6的到来,这样人们使用起来会更简单,不用再纠结于o4-mini-high或o3这样的版本。
05.用户隐私与《纽约时报》诉讼
梅恩:我用o4-mini-high来编程,用o3来进行对话。我觉得,让这些模型变得更强大的一个因素是它们的集成,比如记忆功能。记忆功能从一开始很简单,现在变得越来越复杂。
奥特曼:记忆功能是ChatGPT重大突破。AI结合用户生活背景理解简短提问,多数用户高度认可。未来将提供超个性化服务,但?隐私保护是核心原则?。
梅恩:《纽约时报》起诉要求延长用户记录保留期,公司首席运营官布拉德·莱特卡普(Brad
Lightcap)已回应,请说明立场?
奥特曼:我们将积极应诉并确信胜诉。其要求本质矛盾:以隐私之名迫使AI公司侵害用户隐私。此案应推动社会建立AI隐私框架——毕竟用户正用ChatGPT处理私密对话。
06.ChatGPT会投放广告吗?
梅恩:很多人在使用ChatGPT或对其持怀疑态度时会问,OpenAI现在可以访问这些数据,一方面是训练数据的使用—OpenAI
已经明确说明了何时会使用、何时不会使用;另一方面,比如广告等场景。OpenAI对此的态度是什么?你们会如何承担这种责任?
奥特曼:我们目前尚未推出任何广告产品。我并非完全反对广告,比如Instagram上的广告体验就不错,我也通过它购买过很多东西。但我认为,若要推出广告,必须极其谨慎地处理,以确保不损害用户体验。
梅恩:我希望能找到一个解决方案。我很期待通过ChatGPT或一个优秀的聊天机器人完成所有购物,但很多时候我觉得自己并未做出最明智的决策。不过,这确实是个棘手的问题。
奥特曼:这确实具有挑战性。但如果能找到一种既清晰又符合用户利益的实现方式,将会非常理想。例如,我们可以明确承诺不修改语言模型的输出内容,但若用户点击其中的链接,我们可从中获得交易收入—这对各方而言都是公平的。或许还可以在语言模型输出流之外展示广告,但必须确保这些广告对用户真正有用,且不干扰模型的正常输出。
梅恩:我很欣赏苹果的模式。作为苹果用户,我知道自己为手机支付了较高的费用,但他们不会在设备中塞满多余的内容。
奥特曼:苹果在这方面确实表现出色。他们不像其他公司那样过度依赖广告收入。不过,谷歌搜索曾经是一个非常优秀的产品—尽管现在可能有所下滑,但在一段时间里,即便存在广告,它仍是互联网上最出色的产品之一。我尊重谷歌的很多做法,但显然其中也存在一些问题。
主持人:谷歌本质上是一家广告技术公司,其激励机制与用户利益并非完全一致。而苹果的模式更注重用户体验,尽管他们也尝试过其他业务,但似乎并不成功,这也反映出他们对广告业务并不热衷。
奥特曼:苹果在广告业务上确实不够积极。但我们确实需要在广告与用户体验之间找到平衡点。无论采取何种方式,都必须向用户保持高度的透明与清晰沟通。
07.社交媒体与AI人格设计
梅恩:模型曾出现“过度讨好用户”问题,涉及AI人格定位。OpenAI如何看待?
奥特曼:社交媒体教训深刻:算法为延长使用时长,?无意中引发社会负面效应?。AI若仅迎合单轮对话反馈,将损害用户长期体验。如DALL-E
3曾因用户偏好导致输出趋同,新模型已修正此问题。我们的核心原则是:短期有用不等于长期有益?,需平衡即时反馈与用户成长价值。
梅恩:我注意到DALL-E
3似乎在技术上很有能力,但它的图像风格似乎都趋于一致,这可能是由于用户在比较两个选项时更倾向于选择某种风格,从而导致了这种现象。
奥特曼:我不确定DALL-E 3的情况是否如此,但我认为这是一个很好的例子。我们需要在用户体验和长期利益之间找到平衡。
08.星门计划与算力资源的重要性
梅恩:星门计划传耗资5000亿美元,如何向公众解释其必要性?
奥特曼:它将填补算力与需求的巨大鸿沟。用户一旦体验过10倍/100倍算力提升的价值,自会理解——AI服务全球需空前规模的基础设施,星门计划的目标正是让智能?"丰富且廉价"?。
梅恩:这是一个全球性的巨大项目。我们之前提到,阿联酋是其中一个合作伙伴,你们正在与世界各地的政府合作。有人在社交媒体上问我,5000亿美元,你们有钱吗?
奥特曼:我们目前没有这么多钱存在银行里,但我们将在未来几年内逐步投入。除非出现什么问题,比如我们无法建造这些计算机,否则我相信人们会履行承诺。
梅恩:传言埃隆.马斯克(Elon Musk)曾试图干扰该项目的国际合作?
奥特曼:我曾公开表示(包括公司内部选举后的声明),最初确信埃隆不会滥用政府权力进行不正当竞争。如今我必须承认这个判断是错误的——虽然我向来不愿轻易认错,但更令我痛心的是这种行为对国家造成的伤害,这完全超出了我的预期。值得庆幸的是,本届政府始终坚持原则,果断抵制了这类行为。整件事的发展确实令人深感遗憾。
梅恩:我认为现在的局面已经改变了。就像格雷格.布罗克曼(Greg
Brockman)所说,过去人们觉得谁先跑到终点谁就是赢家,游戏就此结束。但现在我们意识到,还有很多优秀的AI实验室—比如
Anthropic正在开发出色的工具,谷歌也在加速追赶。这不再是某一家独霸天下的局面了。
奥特曼:我认同这一点。我发现人工智能的突破与晶体管的发现有很多相似之处:许多公司会基于它打造伟大的产品,最终这项技术会渗透到几乎所有领域。就像你不会总想着
“我正在用晶体管”,未来很多企业会依托这一重大科学发现建立成功的业务。我希望埃隆能少一些零和思维。
梅恩:从整体来看,这个 “蛋糕”
肯定会越做越大。我最近参加了一个能源会议,人们讨论能源生产和超大规模扩张时,让我联想到能源需求的问题。我知道Grok
3团队甚至得在停车场放置发电机来训练模型—问题是,能源从哪里来?
奥特曼:能源会来自多方面。目前我们依赖天然气、太阳能、核能等多种能源的组合。我对先进的核裂变和核聚变技术尤其期待,但当下仍需依靠综合能源体系。
梅恩:确实是多种能源并用。我听说在阿尔伯塔省等地,能源储备充足但需求不足。这让我意识到,能源问题已经形成了全球性的格局,这是我之前未曾想过的。
奥特曼:传统上,能源的全球运输非常困难。但如果把能源转化为
“智能”,通过互联网传输,就会容易很多。所以可以在多地建设大型训练中心或推理集群,再将输出结果通过网络传送出去。
09.科研与硬件革新
梅恩:詹姆斯.韦伯望远镜面临“数据过剩科学家不足”的问题,AI如何改变科研?
奥特曼:未来或无需新对撞机,AI分析既有数据即可突破高能物理。当前模型已实现旧药新用等成果。
梅恩:推理模型与GPT的区别?
奥特曼:GPT已有基础推理,推理模型则强化?分步思考能力?。用户愿为高质量答案容忍更长响应时间。
梅恩:与乔纳森.艾维(Jonathan Ive)的硬件合作有何进展?
奥特曼:设计追求极致,尚处早期。现有设备为“无AI时代”设计,未来硬件将?感知环境?、深度理解上下文,交互超越传统键盘-屏幕模式。
10.给年轻人的建议
梅恩:给25岁年轻人有什么建议?
奥特曼:战术层如学编程般必要掌握AI工具;战略层锤炼?韧性、创造力、共情力?——这些软实力未来价值倍增。
梅恩:AGI实现后OpenAI会扩招吗?
奥特曼:团队将扩大,但每人生产力远超AGI前时代——技术本为实现人效跃升。