AI终端报告：AI终端时代来临，引领消费电子新浪潮

最新推荐文章于 2025-05-18 20:17:36 发布

AIGC学派

最新推荐文章于 2025-05-18 20:17:36 发布

阅读量1.4k

点赞数 26

文章标签：人工智能

本文链接：https://blog.csdn.net/weixin_54883418/article/details/134949391

版权

今天分享的AI系列深度研究报告：《AI终端报告：AI终端时代来临，引领消费电子新浪潮》。

（报告出品方：国泰君安证券）

报告共计：34页

1. 智能纪元: 大厂 AI终端探索之路

1.1.AI 手机:软件硬件升级加速，打造智能随行助理

1.1.1.终端厂商:头部厂商陆续推出 AI手机

谷歌推出 Pixel8系列新机，内置谷歌 AI基础模型。Pixel8 搭载 GoogleAI定制的Tensor G3 芯片,其中包括最新一代的ARM CPU,升级的 GPU,新的 ISP 和成像 DSP 以及谷歌的下一代TPU。与配置上一代 Tensor 的Pixel6 相比，Pixel8 上运行的 ML 模型数量提升至2 倍，模型结构也更加复杂(比去年 Pixel7 中最复杂的模型复杂 150 倍)。Tensor G3 通过将机器算法直接构建到芯片的方式，以更少功耗实现更强大的功能。此外Pixel8 还预装最新 Android 14，并提供 7年的安卓大版本软件更新，同时支持 WiFi-7 连接。

三星发布自研大模型 Gauss 并推出 Galaxy AI。三星人工智能论坛 2023 上，三星宣布将在 2024 年初推出 Galaxy AI，即在 Galaxy 旗舰落地的端侧 AI 大模型。它将为手机带来 AI Live Translate Call 功能，能在通话中实时进行语音转文字并同步翻译，并且端侧运行可保证通话内容的隐私安全。同时，三星公布了生成式 AI 大模型 Gauss。该模型由三部分组成：

1）Samsung Gauss Language：生成式语言模型，负责简化撰写电子邮件、总结文档和翻译内容等任务；

2）Samsung Gauss Code：简化写代码流程，支持代码描述和测试用例生成等功能；

3）Samsung Gauss Image：生成和编辑图像，包括更改和添加风格、提高分辨率。未来 Gauss 能力将拓展到三星官方 APP。

苹果发布全球首款 3nm 芯片 A17 Pro，内部搭载 16 核 AI 神经引擎，峰值算力达 35TOPs。苹果第一代 Apple 神经网络引擎（ANE）可追溯到 2017 年 iPhone X 的 A11。随着 ANE 所支持的手机应用程序不断增加，其处理性能也不断提升。A17 Pro 每秒可执行最高达 35 万亿次操作，相比 A16 运行机器学习模型的速度提升最快可达 2 倍。它能够支持 iOS 17 中的面容 ID、Live Voicemail、自动纠错、从照片背景中提取主体、为有失语风险的用户创建个人语音等 AI 功能。据彭博报道，苹果正在开发大语言模型和 AI 聊天机器人“Apple GPT”；公司已经部署了基于 AI 增强的搜索、Siri、系统地图等功能，作为公司内部工具，正在开展几项面向消费者的 AI 计划。

华为发布的新一代智能操作系统 HarmonyOS 4，接入了 AI 大模型。小艺成为首个具有 AI 大模型能力的终端语音助手，具备适用于生活、办公场景的助理功能，并在智慧交互、生产效率提升、创建专属场景和个性化服务方面获得提升。

1）智慧交互：在原有的语音交互的基础上，新版小艺能够接受文字、图片、文档等多种形式的输入。华为小艺也能够基于这些信息调用相应 APP 插件，完成添加手机通讯录、美团搜索等操作；

2）生产效率：能够对图片完成文字提取、摘要总结、表格提取、文档扫描等办公功能，让用户更高效的办公学习；

3）个性化服务：在与用户交流中，能够持续进行信息收集、理解，在保护隐私的前提下提供个性化服务。

小米 14 系列发布，率先支持 NPU 部署，内置多款 AI 大模型应用。小米 14 系列搭载高通“AI 引擎”骁龙 8 Gen3，CPU 多核性能超越苹果 A17 Pro，NPU 赋予强大 AI 功能。小米自研图像大模型在 NPU 部署后运行效率大幅提升，内存占用减少 75%、运行时间缩短 95%。同时，小米宣布与金山办公 WPS 进行合作。将 WPS AI 移动 APP 的能力嵌入到小米澎湃 OS 当中。用户通过小米手机拍摄文档后，可以进行内容总结；也可以上传文档来实现快速翻译和内容概括。

VIVO 发布 VIVO X100 系列手机，并全球首发天玑 9300。X100 内部搭载基于百亿蓝心大模型 BlueLM 的 AI 助手“蓝心小 V”，具备自然会话、信息处理和洞察能力，能够实现自然语言对话、AI 路人隐身、文案写作、思维导图生成等功能。

OPPO 发布全新 ColorOS 14 操作系统，Pantanal 与 AndesGPT 双模型实现智慧互融，具备闪速抠图、智能摘要、图片智能消除、内容创作、聊天助手等 AI 功能。系统在端支持 70 亿参数的 AndesGPT·Tiny 大模型，云端支持 AndesGPT·Turbo/Titan 大模型，并以端云协同的方式为小布助手提供自然语言交互能力。

1.1.2. 核心硬件：高通与联发科推出 AI 手机 SoC 处理器

高通推出高性能 AI 引擎“骁龙 8 Gen3”，支持在端运行 100 亿参数的多模态生成式 AI 模型（Stable diffusion 可在 1 秒内生成图像或社交微博；70 亿参数 Llama 2 运行速率高达 20 tokens 每秒），并配套实现 AI 面部识别、智能拍摄对焦、视频物体擦除、视频降噪等基础 AI 功能。为实现相应功能，骁龙 8 Gen3 底层核心全面升级：采用台积电 4nm 工艺，配置高通 Kryo CPU（比前代产品骁龙 8 Gen2 性能提升 30%、效能提升 20%）、高通 Hexagon NPU（性能提升 98%、效能提升 40%）。骁龙 8 Gen3 还配备 Snapdragon X75 5G 调制解调器、支持 LPDDR5X RAM、 UFS 4.0、Wi-Fi 7、蓝牙 5.4 等。高通骁龙 8 Gen3 将在全球 OEM 厂商和智能手机品牌的终端上得到广泛采用，有望开启生成式 AI 手机的新时代。

联发科推出天玑 9300，最高支持在端运行 330 亿参数 AI 大语言模型。硬件方面：天玑 9300CPU 采用“4 超大核+4 大核”设计，性能较上一代提升 40%；集成全新第七代 APU 处理器 APU 790，内置了硬件级生成式 AI 引擎，深度适配 Transformer 模型；集成新一代 GPU，峰值性能提升 46%，功耗节省 40%；集成 Imagiq 990 ISP，可进行 16 层图像语义分割引擎并逐帧优化，提升视频录制细节；内存率先支持 LPDDR5T 9600Mbps。为解决大模型运行下内存紧缺的问题，联发科开发了混合精度 INT4 技术，结合公司的内存硬件压缩技术，能够高效利用内存带宽，大幅减少内存占用。AI 进展方面：天玑 9300 支持终端运行 10 亿、70 亿、130 亿和 330 亿参数的 AI 大语言模型，其中 70 亿参数 LLM 已在 VIVO旗舰手机终端首发落地，并与 VIVO成功在端运行130亿参数 LLM。天玑 9300 在移动显示、音频降噪、5G 通信等领域也融合了 AI 技术。

1.1.3. 系统应用：AI 手机软件开发平台持续优化

高通发布 AI Stack，端到端的 AI 软件解决方案。高通 AI 软件栈是面向 OEM 厂商和开发者的一套完整的 AI 解决方案，通过丰富的 AI 软件权限和兼容性，能够支持各种智能终端，包括智能手机、汽车、XR、计算、物联网和云平台。高通 AI 软件栈支持包括TensorFlow、PyTorch和ONNX 在内的不同 AI 框架与主流 runtimes，以及开发者库与服务、系统软件、工具和编译器，使得任何面向单一终端开发的 AI 特性都可在其他终端上轻松部署。以 Stable Diffusion 为例，高通从 Hugging Face 的 FP32 版本 1-5 开源模型开始，通过量化、编译和硬件加速进行优化，最后实现在搭载骁龙 8 Gen 2 移动平台的手机上运行。

联发科发布 AI 开发平台 NeuroPilot，构建丰富 AI 生态。NeuroPilot 支持 Android、Meta LIama 2、百度文心一言大模型、百川智能百川大模型等前沿主流 AI 大模型，为用户带来包含文字、图像、音乐等领域在内的终端侧生成式 AI 的创新体验。

苹果发布 Core ML 框架，支持 Transformer 架构和 Stable Diffusion。 Core ML 分为计算机视觉、自然语言、语言（转文字）、声音识别等框架，分别负责实现对应功能。用户可以通过 Core ML 在手机上创建模型，并整合到 APP 当中，这意味着 APP 可以使用 Core ML API 和用户数据进行模型预训练、微调和推理。Core ML 会综合利用 CPU、GPU 和神经网络引擎，同时最大程度地减小内存占用空间和功耗，来优化设备端性能。由于模型严格地在用户设备上，因此无需任何网络连接，有助于保护用户数据的私密性和 App 的响应速度。

1.2. 电脑端：AI PC 生态全场景构建，助力办公生产力提升

1.2.1 终端产品：联想等头部品牌积极部署 AIPC

联想部署 AI PC，可运行个人大模型。联想 AI PC 能够创建个性化的本地知识库，通过模型压缩技术运行个人大模型，实现 AI 自然交互，为每个人量身定制的全新智能生产力工具，进一步提高生产力、简化工作流程，并保护个人隐私数据安全，将人工智能带给每一位用户。通过结合个人数据，可以做到更好的大模型效果，在联想 AI PC 模型演示中，针对同一个提问，PC 级 AI Lenovo AI Now 相较于云端 AI 生成回答速度稍慢，但更具个性化。

针对企业端，联想提出混合人工智能计划。联想认为，通过公共大模型与企业大模型相结合，可以解决企业的数据安全担忧。在最初大模型的基础上，企业根据特定数据进行额外的训练和微调并在端侧加入企业知识矢量数据库中的企业特定知识，最后，链接旧有的 ERP 系统、CRM 系统、MES 系统等供应商数据库，即可得到一个混合的 AI 系统，既能够既保证数据安全，也具有泛化知识，同时能够回答企业相关的特定问题，帮助企业规划相关活动。

1.2.2 核心硬件：英特尔、AMD、高通均推出 AIPC 处理器

英特尔：Meteor Lake 处理器平台，首次将神经网络处理单元（NPU）集成到 PC 处理器。在英特尔 on 技术创新大会上，英特尔推出了首款基于 Intel 4 制程工艺打造的 Meteor Lake 处理器平台。Meteor Lake 采用分离式模块架构，由计算模块、SoC 模块、图形模块以及 IO 模块这 4 个独立模块组成，并通过业界出众的 Foveros 3D 封装技术连接。在 SoC 模块中，Meteor Lake 采用了创新的低功耗岛设计，集成了 NPU，为 PC 带来了高能效的 AI 功能表现，并兼容 OpenVINO 等标准化程序接口，便于 AI 的开发及应用普及。新的低功耗能效核，进一步优化节能与性能间的平衡。 NPU 除了专为持续的 AI 带来高能低耗的表现，还可以通过 AI 卸载能力，通过 NPU 降低 CPU 和 GPU 的 AI 工作负载。实现 PC 上 AI 场景的长续航加速。

英特尔公布未来 AI 处理器蓝图，下一代 Lunar Lake 和 Arrow Lake 处理器进一步提升人工智能加速效率。英特尔公布未来 AI 处理器蓝图，推动高能效 AI 规模化发展。下一代的 Arrow Lake 将覆盖桌面和移动平台，主要侧重于提供更高的功率和性能，采用了与 Meteor Lake 相同的设计方法，不过会改用更新的 Intel 20A 工艺制造。LunarLake 则为英特尔下一代低功耗架构，将进一步提升人工智能加速效率，并对 Meteor Lake 和 Arrow Lake 的多芯片设计做了改进，计划在面向移动平台的酷睿 Ultra第 2代处理器 Arrow Lake之后发布。Lunar Lake将采用LionCove 架构的 P-Core 和 Skymont 架构的 E-Core，全新的微架构将提供突破性的每瓦性能优势，同时会采用 Intel18A 工艺制造，标志着该技术的首次商业应用。

AMD 提供从数据中心到工作站、笔记本电脑的人工智能优化解决方案。在联想 2023 Tech World 大会上，ADM 提出将为联想提供从数据中心 ThinkSystem 到 ThinkStation 工作站和 ThinkPad 笔记本电脑的人工智能优化解决方案。AMD 将为联想个人电脑和数据中心产品组合提供人工智能优化解决方案，产品组合将由 AMD Ryzen、EPYC 和 Instinct 处理器驱动。（1）第四代 AMD EPYC 处理器最多可配备 96 个核心，可用于加速一系列数据中心和边缘应用，包括客户支持、零售、汽车、金融服务、医疗和制造业。（2）Instinct 为 AMD 的加速卡系列，Instinct MI300 为全球首款同时集成 CPU、GPU 的数据中心 APU。Instinct MI300A 一共有多达 13 颗小芯片，其中计算部分 9 颗，都是 5nm 工艺制造。CPU 部分为 Zen4 架构，三颗 CCD 芯片，24 个核心，GPU 为最新的 CDNA3 架构，六颗 XCD 芯片，核心单元数量仍未公布，还有 128GB 容量的 HBM3 高带宽内存，可以为 CPU、GPU 所共享。

锐龙 7040 系列处理器中加入了 Ryzen AI 引擎，首款基于 x86 处理器的专用人工智能硬件。AMD 的 Ryzen AI 引擎基于专门设计的 AMD XDNA AI 架构，其核心是多个独立的 AIE 单元，而且与传统的 CPU 多核运算相比，XDNA AI 架构有多个独立的内存电压单元以及对应的内存控制器并拥有独立的高速互连通道，在进行 AI 推理时更加灵活，效率更高，性能也更强。移动平台的 XDNA AI 架构有着超高的能效、强大的算力，它支持不同的 AI 神经网络，比如 CNN（卷积神经网络）、RNN（循环神经网）、LSTM（长短时记忆）等。它还支持 Int8/16/32、BFloat16 等各种高级数据类型，同时 XDNA AI 架构还具备实时多任务能力，可处理最多 4 条并发空间流。

高通 PC AI 平台骁龙 X Elite 发布，专为生成式 AI 而全新打造。骁龙 X Elite 支持在终端侧运行超过 130 亿参数的生成式 AI 模型，引入了高通 AI 引擎核心 Hexagon NPU，通过全新供电系统升级使 NPU 按照工作负载适配功率，兼顾高性能与低能耗，引入微切片推理，加速 Transformer 网络等复杂 AI 模型研发提供支持。同时，高通对张量加速器进行了升级，大矩阵处理速度提升 2.5 倍。共享内存规模增加了一倍，便于容纳更大的神经网络，使 NPU 实现了 45TOPS 的 AI 性能。骁龙 X Elit 采用4nm 制程工艺打造，拥有 12 个高性能核心，集成的 Adreno GPU 支持每秒 4.6 万亿次浮点运算，主频高达 3.8GHz，支持双核增强，最大可达 4.3GHz，也是首个 4GHz 以上的 ARM 架构 CPU 核心。此外，它拥有高达 42MB 的总缓存容量，内存带宽 136GB/s，并支持八通道 LPDDR5x。

1.2.3 系统应用：微软等持续更新 AIPC 操作系统及爆款应用

微软 Windows 11 接入 Copilot 免费更新，培养用户 AI 使用习惯。 Windows Copilot 是微软推出的一款利用 AI 技术，帮助用户在 Windows 系统中更高效、个性化地完成工作、创作和娱乐任务的智能助手，能够预览并加速任务，减少摩擦，节省时间，并提供个性化的答案、灵感和任务帮助。Copilot 系统权限高于 Cortana（将于 2023 年底停止支持），可以实现自然语言交互级别的对话，与系统应用更深度地进行绑定，例如它直接读取浏览器页面内容，生成总结文字。Copilot 还更新了画图、照片、Clipchamp 等应用，其中画图功能可以智能移除图片背景并增加图层功能，照片新增了 AI 背景虚化功能，Clipchamp 提供自动剪辑图片和视频与场景描述功能。微软 Copilot 作为 Windows 11 免费更新的一部分直接嵌入每一位用户的操作系统，优化了系统存在感，默认集成于任务栏，具备专门的 Win+C 热键，很大程度上培养了用户对人工智能的使用习惯。

英特尔 AI PC 加速计划，构建 AI PC 生态系统解决方案，预计 2025 年达成逾 1 亿台 AI 应用。该计划旨在联结独立硬件供应商（IHV）和独立软件供应商（ISV），并充分利用英特尔在 AI 工具链、协作共创、硬件、设计资源、技术经验和共同推广的市场机会等资源。这些资源将帮助产业合作伙伴充分发挥英特处理器的技术和相关的硬件优势，以尽可能最大限度发挥 AI 和机器学习（ML）应用的性能，加速全新应用案例，并吸引更广泛的 PC 产业伙伴融合到 AI PC 生态系统的解决方案中。

1.3. AI 眼镜：集成 AI 助手，开启智能眼镜新时代

Meta 发布智能眼镜 Ray-Ban Meta，支持 Meta AI 助手。Ray-BanMet 在摄像头、麦克风和扬声器上都较前代进行了大幅升级，并搭载了高通 *最新的骁龙 AR1 Gen 1 芯片，可以处理更高质量的照片和视频。智能眼镜提供拍摄照片、录制视频、播放音乐、接听电话、实时翻译等功能。同时，眼镜还支持“Meta Al”这一 Al 助理功能，用户喊出"Hey Meta" 即可唤醒助手进行辅助，这也是首款搭载 Meta Al 的智能眼镜产品。通过 Meta Al，用户可向语音助理咨询各种问题，如自己目前站在哪座建筑前、面前标识的意义、如何修理面前的水龙头等。Ray-Ban 智能眼镜将在 2024 年更新过后支持 Meta Al 功能。

报告共计：34页