微软用Copilot重大更新庆祝成立50周年
美国时间4月4日,微软在其总部园区举办50周年活动暨Copilot更新,微软宣布了旗下人工智能助手Copilot的一系列重磅更新:一口气推出了许多新功能,使其在功能上更接近ChatGPT或Claude等替代产品。
经过更新后,Copilot将支持记忆、个性化设置、基于网页的Agent操作、播客生成、摄像头和屏幕分析、深度研究等众多新功能。
这也是微软致力于让Copilot更加“个人化”的一部分。微软表示,这一想法还在早期阶段,但很快用户就能为Copilot定制个性化外观。
微软AI 首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)在当天的活动中表示:“Copilot不仅仅是一个AI,它是属于你的。50年前,盖茨有了让每个人的桌面有一台个人电脑的疯狂想法,如今我们要让每个人都有个性化的Copilot。”
除了个性化,Copilot的功能也变得更强大。“Actions(操作)”功能赋予它在网页上执行任务的能力,类似OpenAI的Operator Agent或亚马逊最近发布的Nova Act模型。微软表示,它可以被用来订票、预约餐厅或购物,尤其是配合新的购物功能,Copilot可以帮助用户搜索商品、寻找优惠与折扣。
2024年12月,Copilot Vision在网页端上线,目前也扩展到了Windows和移动端应用。
在Windows端,Copilot可以“看见”用户屏幕上其他应用和文件的内容,从而回答用户的提问、交互,在iOS和Android端,它可以通过摄像头识别你看到的内容,或分析相册里的照片并进行讨论。
“深度研究”功能让Copilot能分析大量文档或在线资料,适用于复杂项目的处理。而其研究功能也将与Bing搜索引擎整合,带来AI驱动的搜索体验。
像许多其他AI工具一样,Copilot现在也可以把研究结果生成类似播客的音频介质。此外,一个名为“Pages”的新功能,可以把笔记和研究内容整合在一个画布中,方便整理。
微软方面表示,许多新功能将从今天开始推出“初始版本”,并在“未来几周和几个月”中不断改进。不同功能的可用性将因平台和市场而异。
微软Co-pilot经理Divya Kumar当天对腾讯新闻《一线》表示,Copilot各自的不同功能是由一系列不同的底层模型来实现的,包括OpenAI的基座大模型、微软自己研发的大模型以及开源模型等,在具体模型的选取上,微软的原则是基于Copilot的产品能够带给用户最好的体验。
尽管当天微软所宣布的Copilot一系列更新并不是业界最先提出,例如ChatGPT在去年就推出了记忆功能,谷歌的Gemini也具备实时视觉和互动模式,并且目前几乎所有生成式AI领域的大公司的头部创业公司,都在致力于个性AI Agent的开发和迭代,但微软选择在50周年这个时间节点,选择一次性公布一系列Copilot的功能更新,也充分反映了微软希望向外界传达自己依然是最新的生成式AI领域的头部玩家之一。
当天的活动上微软更多将内容重点放在了Copilot的更新上,较少回顾强调过去50年所取得的成就。正如微软首席执行官纳德拉在当天的开场主旨演讲中所说,微软过去50周年的成就令人瞩目,但微软更看重未来的50年。