苹果新Siri背后是Gemini?库克任内最后一届WWDC揭秘

admin AI新闻 2

2011年10月4日, 蒂姆·库克也就是Tim Cook, 首次作为苹果CEO主持发布会, 恰恰这还是Siri在苹果的首次现身。

十五年之后, 在二零二六年六月九日那天, 库克立于WWDC(苹果全球开发者大会)处于的舞台正中央, 外界广泛地持有这样的认定, 那便是这是他在任职期间的最后一届开发者大会, 然后, Siri再度是成为了被聚焦的重点之处。

只是,它已经不是当年的Siri了。

然而, 即便受到监管规定的限制, 致使新版Siri以及其他苹果新的AI智能特性没办法于中国大陆区域上线, 可它仍旧令不少人有所激动。于一镜到底的展示里, 这个“新siri”能够在绝大多数情景下直接实施调用、索引以及读取聊天记录的操作, 并且支持跨应用开展任务, 甚至还能够借助自然语言生成浏览器插件以及快捷指令。

然而, 促使它进行思考的, 并非全然是苹果自身的能力。在发布会上, 苹果首次清晰地把Google Gemini归入Apple Foundation架构。按照彭博社的报道, 苹果为了此事每年要向Google给付10亿美元。

第三代属于苹果的Apple Foundation Models(AFM), 其图源是发布会的截图。

恰恰于这个时候, 苹果同步推行了Core AI框架, 据此GPT、Claude等第三方模型能够接入Siri以及苹果系统。

回顾过去的十五年间, Siri一直用以呈现苹果对于人工智能的理解开云app官方最新下载地址,这种理解体现为封闭, 体现为自研, 体现为谨慎, 所有的能力均是基于苹果生态内部而生长, 2024年苹果最先提出的Apple Intelligence构想亦是全自研的AI架构。然而, 在AI模型的这场竞赛当中, 苹果并未能够冲到前列去。

十五年以前, Siri开启了语音助手的时代, 十五年往后, 它再度成为苹果命运转折点的见证者, 只是这一回, 苹果不再是先锋, 而是追赶者了。

新的Siri

今年WWDC上,苹果用了大半场发布会的时间讲AI。

是迈克•洛克威尔(Mike Rockwell)站在了舞台之上, 这位长期负责Vision Pro系统架构的高管, 于2025年初将Siri重构项目接手过来。一组新的AI同心圆架构被苹果展示了出来, 用户处于中心位置, 中层是多模态与执行工具, 最外层的是Siri、软件与系统生态。

苹果新的AI架构。图源:发布会截图

屏幕感知、图片理解、文字处理、应用协同等几大部分, 大致构成了Siri的新功能。用户无需再于不同应用间来回切换, 刷到图片时, 能直接识别图片地点, 看到地址时, 可直接向Siri询问规划路线, 浏览网页时, 能直接选中文字向Siri提问, 收到活动邀请时, 可直接让Siri识别时间并加入日历。

这种变化的关键并非是变得更具智慧, 而是趋向更为流畅以及便利。于Mac这块设备上, 用户能够直接把多个文件选定来进行询问, 并不需要上传;在iPhone这个产品上, 能够借助摄像头直接向Siri针对现实世界里的物体提出问题;在照片这个应用还有邮件、备忘录、Safari等应用当中, AI被直接嵌入到原本的工作流程里, 给拍摄好的照片重新去设定构图、 将浏览器标签页整理好、把校对以及优化功能嵌入到键盘从而随时能进行调用。

Siri在iPhone与Mac端的调用。图源:发布会截图

更为关键的是, 旧版Siri的逻辑体现为单轮问答, 新版系统却已着手尝试领会用户具体“正在进行何事”, 它能够依照聊天对象以及过往聊天记录选用各异的交谈语气, 能够依据邮件内容主动给出下一步操作提示, 或者在跨应用场景里预先判断用户意图, 进而提前提供执行路径。

苹果尝试着去重新界定Siri, 将其从一个客服转变成调度中心, 此外还推出了独立的Siri应用。这同样意味着苹果摒弃了诸多往昔的坚持: 原本不打算做聊天机器人, 现今却做了;先前对照片运用AI修图持有保留看法, 如今也增添了。

往昔之时, 苹果于Siri到底是运用自研所得之模型, 还是采用外部之模型这一问题上, 呈现出摇摆不定这一状态。如今, 团队摒弃了全然依靠自身力量研发Apple Foundation Models 这样一个方案了, 反倒转向去选取用以整合外部技术的做法。置于正在展开洽谈合作的Google、Anthropic PBC以及OpenAI这三家公司之中, 苹果最终做出的选择乃是Google。

现如今属于第三代的Apple Foundation Models当中, 有2款是端侧模型, 还有3款是运行在私有云计算平台之上的模型, 这其中有好多借助Google Gemini模型去进行“精炼”。本地模型以及私有云架构, 目的在于确保数据不会被苹果以及其他第三方公司所访问。

今年, WWDC所传递出的信号体现为, Siri已然学会了观看屏幕, 学会了总结网页, 之后还学会了理解照片。然而, 更为关键之处在于苹果战略发生了转变:在AI时代这个大背景下, 它不再一味执着于去做底层能力的提供者, 而是转而更倾向于成为这些能力的组织者。

从不被重视,到寄予厚望

2011年时, Siri仍旧是一款被赋予了想象力的产品, 它的起始点并非在苹果, 而是Siri.Inc所开发的独立App, 此App于2010年在App Store上线, 它的定位乃是能够帮你预订餐厅、查询天气、做好信息整合的“个人秘书”, 其基础技术源自美国国防高级研究计划局, 该局自2003年起就着手投入约1.5亿美元资金去资助虚拟代理人技术开发项目。

在Siri上线3周之后, 苹果公司的创始人史蒂夫·乔布斯(Steve Jobs)对其产生了兴趣, 进而邀请创始人进行会面。过了两个月之后, 苹果公司宣布以2亿美元的价格去收购Siri, 并且将其整合进了在2012年面市的iPhone 4S里面, 使其成为了后者最为重要的功能当中的一个。

可是, 在2011年到2015年这个时间段之内, Siri所进行的更新差不多均为细微调整, 像增添多语言支持这一情况, 还有简单信息查询方面, 以及百科内容接入这一行为, 以及“嘿Siri”唤醒之类的举措。甚至在iOS 15当中, 苹果公司把Siri里面涉及笔记事宜的功能, 还有跟照片相关的功能, 再者叫车方面的功能, 加上支付此类的功能都给删除掉了。直至今日, Siri之上利用效率最高的功能, 依旧是2011年刚初次登场露面时就已然具备的那种能力——设置一个闹钟。

Siri的技术护城河, 并非坚固, 2012年的时候, 三星S Voice在功能方面, 已然和Siri相近, 2014年进行对比测试期间, Google Now在信息理解以及推荐能力上, 反倒超过了Siri, 到2017年, 美国科技媒体The Verge直接评定Siri“明显落后于时代”, 它的领先窗口期实际上极为短暂。

2018年, 美国科技媒体The Information, 披露了一份长篇报道, 报道内容是关于Siri团队变动的。据受访前员工回忆, 在初期阶段, Siri是在尚未准备妥当的情形下面向外界的, 其后端架构并未适配大规模用户流量, 后来一位苹果员工重写了一段代码, 使得Siri某后端组件的服务器需求, 从约500台锐减到了5台。

对于苹果内部而言, 关于Siri , 未能达成定位的统一。其一派观点为, Siri的核心应当是搜索以及检索。然而另一派则秉持, Siri务必演变成真正助手, 是这样的情况。

有以前曾是苹果员工的人讲, “乔布斯是在Siri推出后的次日离世的, 苹果也因之没了前行的方向。”如此一来, Siri的研发长时间处在一种呈分裂状的情形里, 有的人担当语音识别方面的事宜, 有的人承担系统集成方面的工作, 另外有的人从事体验层优化方面的任务。在这样的背景状况下, Siri团队各自为营作战, 缺少统一的演进逻辑。

这种割裂在产品层面也有所延伸, 关于要将Siri搭载至HomePod的消息, Siri团队是在2015年才知晓的, 那时, 苹果为了与2014年底亚马逊所发布的Echo展开竞争, 便匆忙地把Siri应用于该项目之中, 在发布之后, 《纽约时报》作出评价: “HomePod上的Siri糟糕得令人难堪”, 后续HomePod的市场表现欠佳, 也被内部部分人士认定是Siri团队能力欠缺的缘由。

与此同时, 隐私方面的争议成为了Siri长期以来始终存在的阴影, 在2019年的时候, Siri被指责在用户并没有主动刻意去唤醒它的情况下进行录音, 进而把录制的片段发送给外包商让人工去收听, 为此还遭到了集体诉讼, 在公元二一世纪二十五年年初, 美国加州这个区域的法院审批通过了苹果公司就这起案件所达成的和解协议, 最终符合相应条件的用户每一台设备能够获得赔偿大概是八点零二美元, 而单人所能获得的最高赔付是不会超过四十点一美元的。

直到生成式人工智能浪潮到来之际,Siri 的重要程度再次被提至之前状态。新Siri 迎来命运转折的关键点, 是在 2025 年初举行的一场会议。这场会议召集集中了除 CEO Cook 之外的大部分苹果核心领导层人员, 会议证实 Apple Intelligence 的表现没有达到预先期望水平, 并且新一代 Siri 的迭代进程同样将会延迟。

那时, 库克对当时担任AI负责人的约翰•詹南德雷亚(John Giannandrea)丧失了信心, 那主导了Vision Pro新产品问世的洛克威尔主动请求承担任务, 接手了Siri。

后来, 洛克威尔将曾经执掌Vision Pro以及VisionOS操作系统的团队带过来, 当作Siri的全新负责团队, 并且马上开启运用第三方模型的方案, Siri的新路线就这样确定了。

不做软件,回归硬件

与谷歌有着此次合作的苹果, 在每年当中, 需要去给Google支付大概10亿美元, 目的是能够对其AI技术以及基础设施能力加以使用。

过去的二十年当中, 苹果所采取的技术路径, 差不多是构建于芯片自己研发、系统自己研发、服务自己建设的原则之上的。而此次使用Gemini, 官方给出的解释是, 基于经过技术评估之后所产生的结果, 认定Gemini提供了当下“最具能力的基础模型”。

在2022年的时候, 苹果内部团队构建起好几个大语言模型, 然而因其公司高层怀疑“实用性不足”从而被搁置了。在此之后, 苹果在AI方面的投入节奏跟规模显得很保守。在2025财年其研发投入大概是345亿美元, 而在同一时期Meta约有573. 72亿美元, 谷歌大概是610. 87亿美元。

在Siri经历数次延期以后了, 苹果实际上放弃将做全栈大模型作为持续坚持的事, 而是转向回归它深度扎根于硬件部分的生态方面具备的优势性。下一任苹果CEO备受关注作为热门成为有竞选可能的人才这样的约翰•特努斯(John Ternus), 其实就已是当下苹果公司里面, 任职程度称得上高级的硬件工程那个部门的副总裁了。

苹果来说, 原先赛道为更稳定的, 且是更安全那样的, 就算不掌握模型自身, 依旧能够于分发层获取益处。有报道称, 2025年时苹果单单凭借App Store就从生成式AI应用方面抽取了将近9亿美元的佣金, 2026年预计会突破10亿美元。

此时, 苹果仍在加大对AI的投入, 只是方向有所改变。今年第一季度财报表明, 在苹果30年至今的历程里, 研发支出占收入比例首次超出10%, 单季度研发支出达到114亿美元, 与同比相比增长了34%。库克在谈到研发数据时讲了, 公司加大投资的部分原因是, 其察觉到的人工智能增长潜力。

不过, 苹果的投入结构, 与Google的路径明显不同, 与Microsoft的路径明显不同, 与Meta的路径明显不同。有分析认为, 这部分的研发投入增长, 很大程度上可能与人才培训有关, 它和建模实验有关, 它和设备内AI有关, 它和私有云计算有关, 它和定制芯片有关, 它和隐私保护有关, 而非大规模数据中心部署, 是端侧优先的AI战略, 而不是云端模型竞赛。

至于最终做了选择开云真人app官方版入口,开云真人app官网入口开云手机入口app下载开云app官方入口网站,选择了Google Gemini, 这其中的缘由, 或许是基于对整体战略进行了一番考量而后得出的结果。

在2026年5月的时候, 官方进行了披露, Google Gemini月度活跃的用户数量已然已然达到了9亿, 在并非英语的地区, 其流量规模差不多快要接近GPT的七成。Google进行过一次算账, 要是企业把80%的顶级模型调用替换成最新一代的Gemini 3.5 Flash, 那么在一年的时间里是能够节省10亿美元的。

并且, Gemini已被系统地装进了谷歌诸如搜索、地图、Gmail、YouTube、Chrome等核心产品之中。在苹果发布会前几周的时候, Google于自身的开发者活动里, 把操作系统上Gemini的新功能重新称作“Gemini Intelligence”, 企图将Gemini从一个聊天机器人转变成在手机、浏览器、汽车以及笔记本电脑上运行的一方。

OpenAI这边是另一个备选对象, 然而双方关系呈现出不稳定的状态, 按照彭博社所报道的情况来说, 有一位匿名的OpenAI高管声称, “从产品角度出发, 我们已经将所有事情都做了, 而他们却没有, 更为糟糕的是, 他们甚至都未曾真正付出过努力”, 并且, 自去年开始, OpenAI为了实现硬件方面的发展, 从iPhone、Vision Pro头显、音频技术以及几乎涵盖所有硬件和设计部门, 挖走了数十名苹果工程师, 这种举措在一定程度上对双方长期合作的意愿造成了削弱。

与之相较, Google在进行合作之时, 也显得更为积极, 且更具连续性。在AI于从工具朝着代理转变的进程当中, 哪一方掌控系统级入口, 那一方便掌控分发权, 而iOS属于全球最为稳定的高价值入口当中的一个。身为长期搜索合作伙伴, 双方早就于iOS搜索入口、广告分发以及流量结构方面形成稳定关系。

苹果运用系统入口来替换技术能力, 谷歌凭借iPhone去实现AI野心。这两家公司借助软硬件的深度捆绑方式, 想要在由AI主导的下一代终端当中, 把控系统级入口的控制权。

参考资料

凤凰网, 科技领域, 提及这样一篇文章, 名为《一场没有惊喜的苹果发布会, 和一次必须成功的认输》。

云见 Insight:《苹果AI往事》

_infoQ_: 《一开始就处于顶峰状态, 然而十年过后却变得如同平常人一样, 苹果究竟凭借什么去挽救_siri_呢? 》。

摩登AI:《苹果打破30年铁律,库克交棒前按下一个按钮》

古明地正俊、长谷佳明:《AI人工智能的现在‧未来进行式》

标签: AI Siri 苹果 GoogleGemini 技术战略

上一篇Chat GPT写文章好用吗 看看这些真实体验

下一篇当前分类已是最新一篇

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~