智能的 Siri 明年再见,AI 创新交给数百万开发者。
晚点LatePost 文丨贺乾明 黄俊杰
制图丨黄帧昕
编辑丨黄俊杰
《苹果发布令人失望的一季报》
苹果宣布其销售速度在第一财季显著放缓,这将导致该季度营收和盈利表现低于预期……
截图来自苹果官网
以上是苹果 15 年前业绩下滑时所发布的官方新闻稿的开始,没有修饰、没有辩解。今天已经几乎不再能看到一个上市公司以这样的诚实公开面对失败,包括苹果自己。
北京时间 6 月 10 日凌晨,WWDC 全球开发者大会上,苹果以今天它所能有的最大程度暗示了自己的失误。在两小时的新系统、新用户界面、新功能逐一介绍前,苹果 CEO 蒂姆·库克没有再回顾苹果的各种进展,他的软件负责人克雷格·费德里吉(Craig Federighi)上来先说了两点:
去年宣布的 Apple Intelligence 很多功能上线了,但引入 AI 的新 Siri 要达到苹果的质量标准还需要更多时间,明年会有更多消息。
苹果通过 “基础模型框架”(Foundation Models framework)对所有应用开放本地模型(或者叫端侧模型)。
今天,这个市值 3 万亿美元公司的霸权不会因为一年,甚至三年不升级系统用户界面设计而被动摇。
但苹果在今天最重要的软件技术研发上远远落后于对手。Apple Intelligence 发布一年也没有兑现最初承诺的功能,苹果 AI 的负责人,曾经在 Google 负责收购 DeepMind、把 AI 融入核心产品的约翰·吉安南德雷亚(John Giannandrea)已经被解除大部分管理职责。
今年 1 月,库克让苹果的救火队长金·沃拉斯(Kim Vorrath) 接管 Apple Intelligence 和 Siri 的开发管理。这位软件项目管理副总裁 1987 年就加入苹果——如果乔布斯活到现在且一直在工作,在职时间都比她少一年。在初代 iPhone、第一款 Apple Watch、Vision Pro 等划时代产品进度落后时,都是沃拉斯带队调整团队架构、砍去功能、在周末开产品冲刺会,最终让产品能够按期发布。
今天 Apple Intelligence 相关的一系列调整都是对早先失败的补救,需要更长时间才会有结果。
开放本地模型则是 AI 生态的显著进展。AI 软件开发者以几行代码就能调用 iPhone、iPad、MacBook 内置的模型。新模型性能基本达到 GPT-3.5 水平,虽然幻觉会更严重,但可以离线使用,最重要的是开发者不需要付一分钱就能用——用户在买硬件的时候付过了。
这是今天这个两小时发布会上带来的最重要进展,在今天只有苹果才可能实现。
AI 应用的困境,大模型费用跟着用户使用量等比增长
“调一次 DeepSeek 的大模型就花掉几分钱,累加起来很容易能吞掉所有利润。” 笔记应用 flomo 联合创始人刘少楠对《晚点 LatePost》说,用贵的模型效果好,商业上未必成立,一个用户调用模型花的钱很容易就会超过他付的费用。
但不用大模型,体验又确实有差异。“就像移动互联网到来时,同行都做了 App,而你只有网页版,注定会被淘汰。” 刘少楠说开发者没有太多选择。现在他设计新功能,都会花 1/3 时间算成本:多少用户会用?每天用几次?如何让用户满意,但又能减少交互轮次——每用一次多一笔费用,一年 99 元的会员费可能很快就没了。
在移动互联网时代,他很少会这么仔细算账。因为曾经软件和互联网产品都是低边际成本,只要不涉及线下补贴,一个生意的成本通常不会随着用户规模增加等比扩张。早期试错成本可控,用户多了以后也比较容易盈利。
大模型不一样,算力极贵,开发者成本随着使用量等比上升,没有规模效应,只有线性增长。每个应用一出生就进入美团、滴滴早年一样的高难度模式,要么能融资、要么会算账。
多领国今年一季度毛利从一年前的 73% 跌到了 71%,少赚 400 多万美元,主要原因就是上线 AI 功能。多领国只有 7% 的付费用户选择了支持大模型的 Max 会员,而且每个人月费翻倍到 30 美元。如果更多人用大模型,它的利润率下滑将更剧烈。
OpenAI ChatGPT 的数据更惊人:每个月有 2000 万人支付超过 20 美元,毛利率只有 40%,比卖硬件的苹果低得多。而传统 SaaS 能到 75% 以上。算上研发成本,OpenAI 今年预计要亏近 100 亿美元。
“如果每个功能都用领先的大模型,怎么算都是亏。” 多位 AI 产品开发者告诉我们。一位国内头部云厂商高管则表示,大模型价格已经足够低,短期内很难再有大幅下降。
成本增加风险,风险限制创新,新兴的 AI 应用行业更难跑出新公司。
免费的本地模型,性能追上第一代 ChatGPT
苹果开放的本地语言模型参数 30 亿,在其内部基准测试中能力接近 Google 前不久发布的 Gemma 3(40 亿参数)。比去年的版本有明显提升。
苹果称,它可以用来生成摘要、提取信息、理解文本、优化内容,或者生成游戏中的对话等。在大模型竞技场(Chatbot Arena)的评测中,40 亿参数的 Gemma 3 得分已经接近 GPT-4。
就像开发者调用云上部署的大模型开发应用一样,开发者可以用自有数据训练苹果基础模型的 “适配器”(adapter),让模型解决特定任务时效果更好,还能调用工具扩展模型功能,比如搜索本地或在线数据库中的信息,或者调用应用程序中的服务。
苹果提供的 30 亿参数基础模型 “幻觉” 多于 1750 亿参数的 GPT-3.5,但不少任务并不需要这些能力。
“大模型的优势在于记住了大量世界知识,能稳定输出并做复杂推理。” 一位研究小参数模型的研究员说。“小参数模型已经足够复杂,也有强大的推理能力。”
比如让大模型写一篇含敏感信息的文章,只有成文环节需要云端大模型,脱敏、润色、修改等步骤,本地模型就能完成。
本地模型对于更复杂的应用也有帮助,根据我们测算,如果使用推理模型里比较便宜的 DeepSeek-R1,开发者哪怕只是在手机分流 10% 的大模型调用量,每年支持 100 万日活应用就能节省超过 300 万元模型费用。
“就算不考虑隐私和成本,本地模型也有优势。“ 上述研究员说。研究者正尝试去实现 “自主学习”:根据用户使用模型的数据,持续增强大模型。本地算力免费,可以根据不同用户的需求,让模型衍生出不同的版本。
而云上部署模型想要成本可控,就要让客户大规模调用一个模型,用大规模并发摊薄成本,且要考虑访问的峰谷问题。如果云上推理不同的模型,云厂商要么涨价,要么亏更多。
不过苹果免费开放的本地模型,还不支持 “自主学习” 功能。
开放的本地语言模型之外,苹果新训练了一款在私有云中部署的新语言模型,采用 MoE 架构,总参数达到 1000 亿,回答问题时激活参数 170 亿,在内部基准测试中超过了参数相当的开源模型 Llama-4-Scout,但能力还比不上参数更大的 Qwen-3-235B、GPT-4o。
苹果还训练了视觉模型,本地版本有 3 亿参数,云端模型有 10 亿参数,内部基准测试中效果超过 Qwen-2.5-VL-32B,比 Llama-4-Scout 和 GPT–4o 更差。目前它们只供 Apple Intelligence 使用。按照目前的进展,苹果大概率也会将视觉模型的本地版对外开放。
追赶靠的是数十年积累的软硬件控制力
苹果的大模型研发是美国科技七巨头里最晚的,研发能力很可能也是最弱的。它最新的本地模型也不一定比 Google 强,但随着这一轮操作系统更新,用上本地模型的设备基数将远远大过整个 Android 生态。
上个月,Google 向 Android 开发者提供集成本地模型 Gemini Nano 的开发工具,但不像苹果直接开放大模型的 API,只有摘要总结、润色文本、改写文本、描述图像这 4 个定制好的 API,这限制了开发者的创造力。并且这些 API 只有运行内存超过 16 GB、用上先进芯片的手机才能使用——全球上千款在售的 Android 机型,现在只支持 22 款。
在手机上顺畅运行大模型,需要模型开发者、操作系统供应商、硬件厂商、芯片公司共同参与,是一个系统工程。在销量有限的 Pixel 品牌之外,Google 只占其中两层。
“如果芯片公司不愿意开放更多权限,再强的模型也发挥不出来好效果。” 一位小参数模型研究者说,为 Android 手机开发大模型,基本都需要适配不同芯片公司的底层框架,而这些芯片厂商都想要抓住机会做 “移动端 CUDA”,绑定开发者获得更大的市场空间。
电脑更复杂,美国芯片公司正陷入一场内战:原本开发 CPU 的英特尔、AMD 想推广自家的 GPU;英伟达要开发电脑用的 SoC;高通想统一手机、电脑芯片架构,也开发了电脑 SoC。
控制芯片设计、操作系统、硬件生产、应用商店全流程的苹果没有这些麻烦。它的开发者可以只熟悉一种框架,就可以开发出部署到 iPhone、Mac、iPad、vision Pro 上的 AI 应用。苹果在最新的开发文档中告诉开发者,不用考虑 AI 应用运行的系统。
过去几年,苹果甚至还统一了不同设备的规格,让所有的新产品都能满足运行本地模型的条件。
2022 年的 iPhone 14 开始,苹果给低端的非 Pro 系列使用上一代芯片,以增加差异性。但这个策略只执行了两年。
从 iPhone 16 系列开始,苹果又把同代手机芯片拉到同等水平。包括单摄像头的 iPhone 16e 在内,所有 iPhone 都用上同样的 8GB 运行内存、NPU 算力都是 35 TOPS——最大的差别是少了一两个 GPU 内核,并不影响运行大模型。
2024 年开始,iPad 全都提升到至少 8GB 内存。Mac 电脑则从 16GB 起步,能运行 70 亿参数的模型。
10 亿 iPhone 用户平均三年多换一次手机。这意味着到明年结束,大多数人手中的 iPhone 都已经可以在本地运行大模型。AI 应用开发者不可能忽视这样一个庞大的统一市场。
Apple Intelligence 本该是苹果的样板应用,现在创新只能寄望于应用开发者
2007 年,iPhone 刚发布时还没有应用商店,除了手机基本的电话、短信等功能之外,只有浏览器、iPod、股票、日历等几个应用。当时还没怎么涉足互联网服务的苹果拉 Google 做了地图和 YouTube 应用。
这些应用最终成为现代智能手机的样板应用,告诉开发者可以做出怎样的新应用。次年 App Store 上线,移动互联网时代就此开始,创造了一个又一个新巨头,也让苹果成为 3 万多亿美元市值,净利润接近千亿美元——在全球仅略低于垄断沙特石油的沙特阿美公司。
Apple Intelligence 本该是控制一切软硬件的苹果再次打样,告诉开发者,AI 应用的未来在哪里。
苹果在 2018 年就从 Google 挖来资深管理者约翰·詹南德雷亚,并为 AI 设立了独立的组织架构。它在去年 WWDC 允诺新版 Siri 将有三个能力:
调用邮件、短信、文件、联系人等个人信息回答用户提问。比如 “妈妈会乘坐哪个航班、什么时候到来”“XXX 推荐的书单是什么” 等等。
理解屏幕上发生的事情,自动执行操作。比如朋友发来新地址,可以让 Siri 存到联系人信息中。
横跨多个应用执行任务。理论上可以比较美团外卖、饿了么、京东外卖的肯德基价格,自动下单——也就是现在许多公司设想的手机 Agent。
到现在一个都没有变成现实。
几经延迟上线的其他 Apple Intelligence 功能,实际表现也极其糟糕:系统通知总结出现幻觉,错误将 BBC 关于美国医保 CEO 刺客被捕的报道总结成枪击者在狱中自杀;文本生成表情包的 Genmoji 功能勉强能用,《168开奖结果下载最新版》但手机发烫严重;文生图 Image Playground 表现接近幼儿园水平。
这是苹果从组织管理到研发投入方面的失败。据媒体报道,当时统管 AI 的詹南德雷亚怀疑大模型的价值,他认为用户可能不需要 ChatGPT 这类工具。
苹果也没有迅速加大 AI 基建投入。OpenAI 发布 GPT-4 之后,美国科技巨头全部大举扩张,投建新的算力中心,争抢研究者。苹果的研发投入、算力基建(资本开支)都一度下滑,直到 2024 年底才开始大幅增加。
左右滑动查看
今年上半年,詹南德雷亚的职权大幅削减,Siri 交给原本负责 Vision Pro 的高管迈克·洛克威尔(Mike Rockwell)。Apple Intelligence 功能的开发,也像苹果研发 iPhone、Mac 这些硬件产品一样,分散到不同的团队中。
苹果最新发布的 Apple Intelligence 功能有了明显变化,现在都融入到各个操作系统中的垂直场景中:
iPhone 的通话功能中新增通话保持助理,它可以帮你排队等人工客服接电话,或者预筛陌生的电话;
通话、FaceTime、短信等场景增加 “同传功能”,本地模型可以实时翻译语音通话、短信交流时的不同语言;
原本只用本地模型支持的文生图功能,现在也可以调用 ChatGPT 处理(去年仅限于 Siri 使用);
用 Apple Watch 运动时,配上一个分析你运动记录的话痨虚拟教练,在你耳边解说运动情况,然后鼓励你;
Mac 上的 Intelligence Actions 功能,可以直接调用本地模型、苹果私有云模型或 ChatGPT 执行指定任务。
相对大一点的新功能是 “Visual Intelligence”,由苹果新训练的视觉模型提供支持。当你截屏后,图片下方会自动跳出来 “操作建议”,比如搜索同款商品购买、提取活动信息加入到日历中。
苹果展示 Visual Intelligence 功能。
这像苹果去年给改版 Siri 设计的理解屏幕内容功能变体,但苹果限制了它的功能,只提供特定的操作建议。如果你想要更高的自由度,可以直接点击左下角的按钮,向 ChatGPT 提问。
这些 Apple Intelligence 的新功能大多为苹果高管在设备上实际操作,而不是像去年那样用视频展示 Demo。它们甚至不全由大模型驱动,也不再显得无所不能。苹果更希望它们可控、能如期交付。
“我们相信,要拥有和掌控我们所制造产品背后的主要技术”
2009 年,当时还是苹果首席运营官的库克代替癌症病情恶化的乔布斯参加财报电话会。分析师问他的第一个问题是 “在没有乔布斯的情况下,苹果将如何运作”。
“我们相信,要拥有和掌控我们所制造产品背后的主要技术,并且只进入那些我们能够做出重大贡献的市场。” 库克说。
过去十几年,苹果对硬件制造,特别是芯片技术坚定投入。到 2023 年,台积电被苹果推着去造 3 纳米制程工艺芯片的时候,三星、高通等对手已经不再愿意巨资采购这样的新技术。
库克是一个了不起的接班经理人,因为他紧紧抓住硬件背后的主要技术,保证了苹果连续十多年的惊人增长。当大模型快速进化,逐渐能完成一个又一个不同的任务,整个行业需要个人手机、电脑分担运算成本的时候,只有苹果能及时普及这样的基础设施。今天苹果能在初代 ChatGPT 上线两年半之后把跟它同等性能的模型装进几亿 iPhone。
但他没能掌控大模型爆发后的主要技术。于是今天苹果的 AI 研发依然显著落后于主要科技巨头。特别是目前最先进的推理大模型,苹果没有拿出任何有竞争力的产品。与此同时,OpenAI、Google 的大模型哪怕跟半年前相比都有长足进展,差距越来越大。
在 AI 的权力游戏里,苹果的话语权将不得不比移动互联网时代有所降低,它会更依赖第三方开发者的创新。这对苹果庞大财富的继续增长是个问题,特别是现在欧盟和美国政府都开始限制苹果对应用商店的管控,直接影响它的抽成能力。但对于整个软件生态的创新,这是件好事。
责任编辑:凌辰