去年10 月,小米澎湃OS基建落成,统一融合内核覆盖全品类,完成技术框架的搭建,就如同铸就了一栋摩天大楼坚固的骨架。而今年,小米澎湃OS 2在此基础上再次焕新,迎来了能力的全面绽放,并推出了全新一代澎湃内核——「Xiaomi HyperCore」,主攻性能、图形渲染、安全、网络四大根技术,实现从技术到体验,一次蜕变式的升级。
接下来,就让我们深入探索Xiaomi HyperCore,看看技术团队是如何实现“一触快”与“一眼新”的全新体验。
01
强劲性能
为了全面提升性能,Xiaomi HyperCore从自研微架构调度器、小米级联带宽、小米焕新存储三个方面,深入硬件底层,逐层构建,强劲提效。
▍自研微架构调度器
调度器作为操作系统内核的基石,承载着高效、有序地管理和分配CPU资源的重任,确保各类任务能以最短的执行时间完成。然而,在实际情况中,任务的执行时长由两部分构成:真正的工作时长和空转时长,
其中空转时长是处理器因等待内存访问等操作而暂时闲置的时间段,就像是任务执行过程中的“水分”,造成了CPU资源的暂时闲置。但当前行业内的负载评估机制并无法精确地将工作时长与空转时长区分开来,这就增加了优化资源利用率的难度。
为此,我们从微架构入手、解析指令流水线,进行一次技术下潜,以实现最大限度地降低空转时长,把任务执行过程中的“水分”拧干,从而提升整体的系统性能和资源利用效率。
1/ 微架构流水线分析系统
在处理器设计中,流水线(Pipelining)是一种提高数据处理效率的重要技术。它将指令的执行过程分解为多个阶段(如取指令、译码、执行等),每个阶段可以并行处理不同的指令,从而加快整体执行速度。
在此基础上,Xiaomi HyperCore新增了“微架构流水线分析系统”,通过对任务指令执行过程的实时TOPDOWN在线拆解,微秒级地分析出每个任务的“指令执行周期数”(实际工作负载)以及“访存延时周期数”(空转时长),从而将任务执行过程从“黑盒”变为“白盒”,实现了对任务执行过程的精细化把控。
2/ 一体化调频机制,协同调度性能
接着,Xiaomi HyperCore通过一体化调频机制,实现了CPU、Cache(高速缓存)和DDR(动态随机存取存储器)的资源分配。当监测到CPU空转现象时,该机制能够迅速通过动态智能分配,有效降低空转占比,进而提升系统的整体性能和响应速度。
最终,小米自研微架构调度器通过深度优化任务执行过程,实现了对CPU资源的精准管理和高效利用,为提升系统性能和用户体验奠定了坚实的技术基础。
▍小米级联带宽
随着智能手机与平板电脑等移动设备的广泛普及,应用程序数量及其对内存的需求日益增长,如何在移动设备有限的内存资源中挖掘潜力,提升运行效率,成为了操作系统与硬件制造商共同探索的课题。小米级联带宽,正是在此背景下应运而生,它通过一系列创新策略,实现了内存资源的动态调整与高效利用。
1/ MPAM
首先,MPAM(Memory System Resource Partitioning and Monitoring)技术的引入,为内存管理带来了革新。作为Arm架构的可选扩展,MPAM通过精准分配片上缓存资源,显著提升了高优先级计算任务的执行效率,实现了cache命中率的大幅增长,原神功耗降低2%的收益,同时降低了45%top30应用冷启动时的掉帧率。
2/ 数据冷热分离
其次,数据冷热分离策略进一步提升了内存资源的利用效率,通过学习应用程序的内存访问模式,精准识别并回收低频访问数据,将其重新分配给更需要的应用,从而提高了高频访问数据的驻留率。这一改进使得top10连续应用的冷启动时间缩短了8%,剩余内存增加了7%,同时内存分配进入慢速路径的概率下降40%,有效避免了内存资源的浪费。
3/ 精准预加载
再者,精准预加载技术通过AI学习用户行为,智能预测应用程序的内存需求,提前将数据从UFS(通用闪存)加载至内存,既避免了常驻内存带来的资源浪费,又降低了UFS I/O操作对性能的影响。最终,TOP10应用的冷启动I/O耗时降低了55%,冷启动时长也缩短了4%,显著提升了用户体验。
4/ 动态内存技术
此外,Xiaomi HyperCore使用了动态混合大页技术,解决了传统4KB内存申请制带来的性能瓶颈。该技术可以根据预测的内存需求,智能调整内存页面大小,减少了内存碎片化,提高了内存资源的利用效率。以打开单一APP需要申请128K内存为例,过往按照单次4K进行申请,需要申请32次才能得到完整内存,采用64K页面管理后,仅需要申请两次,显著降低了时间消耗与资源占用。同时,该技术还能根据负载情况,动态调整内存管理的颗粒度,实现4K至64K的灵活切换。
5/ 内存深度融合
最后,Xiaomi HyperCore使用了内存深度融合的swapbooster功能,并对此进行了功能迭代,不仅在系统上对交换的数据进行分析及标记;在硬件上更与UFS供应商合作, 对这部分数据进行客制化管理,以提升数据换入换出速率,最终,在应用连续启动速率测试中最高可带来10%的收益。不仅如此,这种特殊的管理方式也能有效减缓UFS的寿命消耗,提升手机耐用性,带来了更好的用户体验。
▍小米焕新存储2.0
在存储优化方面,关注的则是提升存储系统的读写速度和访问效率。传统上每次我们访问闪存都需要通过多级映射表,逐级查找,才能在真实的物理位置找到所需数据。随着闪存容量迈入TB时代,用户数据量激增,传统多级映射表在数据访问时显得尤为繁琐,犹如树根般错综复杂,严重影响了访问效率。
早在Xiaomi 12S系列发布时,我们便推出了自研的焕新存储1.0技术(FBO 1.0)。该技术将相关联的数据实现物理地址的连续化,极大提升了闪存的随机读写性能,并写入UFS 4.0规范标准,开创性地实现了“整存零取”的高效存储模式。
而全新的小米焕新存储2.0(FBO 2.0)在1.0的基础上再次突破,进一步简化了映射表,实现了在大物理地址空间内的直接数据定位,实现了“整存整取”,大幅减少了访问流程。
在加速数据存取的同时,我们还加入了“存储带宽的不公平分配”策略,将宝贵的存储带宽资源优先分配给对用户流畅度至关重要的前台应用,进一步提升了关键任务的执行性能。
在Xiaomi HyperCore中,微架构调度器、小米级联带宽与小米焕新存储2.0三者紧密协作,相互增强。小米级联带宽优化内存分配,助力微架构调度器高效利用CPU资源;小米焕新存储2.0三者则加速读写,为调度器提供快速访存支持,并反过来促进内存效率提升。
三者协同,实现了连续应用启动领先行业第一20个主流应用连续启动,响应时延/完成时延领先、重载游戏满帧单帧功耗第一、重载游戏复合任务(游戏+视频通话)流畅度第一的成效,带来了更加流畅、高效的使用体验。
02
图形架构
在图形能力方面,小米澎湃OS 2秉承“生命感美学”的设计理念再次升级。而在焕然一新的美学盛宴背后,是对底层图形技术管线的深度重塑与革新,实现了算法与硬件的深度融合,让视觉体验更加细腻且个性化。
▍联合渲染
图形渲染的核心功能是通过模拟光线与材质的相互作用,创建逼真的图像。在传统的多窗口渲染中,每个窗口都独立进行渲染,再合成送显,这不仅效率低下、限制高级特效的实现性,还造成了大量的重复渲染和资源浪费。
因此,Xiaomi HyperCore改变思路,在系统中从0到1去建构渲染路径,通过图形API剔除渲染区域的能力,在底层窗口渲染的时候不绘制上层窗口覆盖的区域,实现了“按需渲染”,精简了渲染链路,不仅提升了渲染速度,还降低了功耗。最终实现渲染速度提升高达20%同时多窗口功耗降低5%,让每一次渲染都更加高效、节能。
▍动画算法
除了让渲染更加高效,小米的动画算法也显著提升了用户体验。过去,用户在拖动或打开界面时常常感受到“延迟感”。通过Xiaomi HyperCore技术,小米从人因工程的视角出发,精确捕捉到动画中的细微感官差异,并通过弹簧公式进行数学表达,在原有算法中加入了人因因素、增加冲量和可变弹簧等一系列算法改进。这种优化类似于在汽车转弯时适当加速,使得转弯过程更加流畅。最终实现了甩得出去,并且快手速也收得回来的离手动画,以及界面运动和手势运动完全统一的跟手体验。
▍自适应纹理压缩技术
同时,Xiaomi HyperCore也引入自适应纹理压缩技术(Adaptive Scalable Texture Compression, ASTC),这是为了解决多个应用同时驻留在后台时,每个应用的最后页面被以 JPG 格式存储而占用大量内存的情况。ASTC是一种GPU友好且高效的纹理压缩格式,它可以直接被GPU访问和渲染,无需额外的转码或解压过程,不仅大大降低了后台任务快照对内存的占用,还简化了处理流程,实现了双向提速。在20个应用后台的场景下,常用内存占用减少了265MB,而在20个应用连续启动的测试中,流畅度更是提升了26.8%,让用户的每一次切换都自然流畅。
▍3D空间虚化技术
除此之外,我们还关注到传统自然渐变虚化技术面临的计算量大、延迟高、功耗高等挑战。以1080p画面为例,采用传统高斯模糊算法来达成自然渐变模糊,每个像素点需经历多达7次计算,整幅画面就涉及1400万次计算,由此产生的显著的延迟及高昂功耗。
为突破这一瓶颈,我们创新性地提出了将2D平面模糊转换为3D空间虚化的新策略。这一方法不再依赖于对每个像素点的繁复计算,转而利用3D空间信息,模拟出更为自然的虚化效果。这主要是利用GPU的mipmap特性,该技术通过预先生成多分辨率纹理图像集,确保渲染时能迅速选取最适宜的纹理层级。在此基础上,我们通过公式,将一个像素点在mipmap中的空间位置、缩放倍率、深度信息、模糊系数等进行加权计算,得到类似于相机虚化的自然过渡渐变效果。
相较于传统高斯模糊算法,这种方法在资源消耗方面极低。整个画面的虚化处理仅需1.5ms,相较于原先的20ms延迟,处理效率实现了惊人的12倍提升,这一突破解决了移动设备上的性能瓶颈。
▍端侧实时视频抠图
在追求基础体验更加流畅的同时,Xiaomi HyperCore还使用端侧实时视频抠图技术,利用设备的计算能力,在视频流中实时识别并分离出前景对象(如人物),随后将其与背景进行无缝替换,从而实现视频抠图效果。
而为了将这一技术完美落地于手机端,Xiaomi HyperCore精心构建了一套全新的端侧实时视频抠图处理链路:
首先,我们依托神经处理单元(NPU)的高效计算能力,结合自主研发的端侧AI模型,实现了抠图过程的快速与准确,且在模型内置了抗精度损失算子,以减少在抠图过程中的精度损失。
其次,我们将GPU计算融入抠图流程,针对高频信号(如毛发、纹理等细节)进行专项处理。如此不仅保证了抠图后细节的完整性,还成功避免了穿帮现象的发生。
最后,为了提升视频画面的连贯性和稳定性,我们在计算下一帧时,会同步参考前一帧的信息。这种帧间参考机制,进一步增强了视频抠图的流畅度和观感。
Xiaomi HyperCore正是通过多项前沿技术的深度应用与融合,使小米澎湃OS 2得以实现全球首发的景深视频壁纸:先做扣图,插入文字,然后将视频中的每一帧都做出景深效果,然后再将抠图内容放回每一帧,这样就形成了景深视频,最后设置成锁屏界面。和单纯的CPU计算效率提升12倍,单帧耗时节省92%。
03
网络通信
Xiaomi HyperCore网络技术,源自小米对5G蜂窝技术的深刻洞察与积累。早在2015年,小米便组建了5G预研团队,深耕技术,厚积薄发。至2023年,小米首次登榜5G标准必要专利,初显成果;2024年,更是跃居国内前三,全球第八,成为Top10中最年轻的一员。在此基础上,Xiaomi HyperCore在蜂窝、Wi-Fi、蓝牙三方面也迎来全面革新。
在蜂窝技术方面,小米首发全新“5G全链路感知预测引擎”,融合AI信号预测与信号地图,精准感知预测5G网络,提前识别与预加载内容,提升了网络连接的速度和稳定性,使高铁地铁出行同样稳定在线;除此之外,还增强了蜂窝、交互、安全能力,支持超过200个国家和地区的全球500+运营商,全球上网APP无卡一键即连,实现了全球出行无缝畅联。
而在Wi-Fi领域则通过互联零拷贝技术,直接在内核层完成文件收发,大幅提升传输速度与效率。并实现了网络延迟预测,调度最优的网络资源,使游戏高延迟降低了53%。与此同时,在诸如进出家门、进出公司的蜂窝与Wi-Fi切换场景中,Xiaomi HyperCore则利用Multi-Link多网智联协同技术,智能评估信号质量,实现蜂窝Wi-Fi无感切换。
最后,Xiaomi HyperCore蓝牙技术则整合了高压缩比语音编码、多通道冗余调制等技术,不仅实现了公里级无网通讯,还解锁了两大关键场景:“星辰无网通”与“关机定位查找”。前者让手机在无蜂窝信号环境下也能通话,最远可达3.5公里,解决了户外徒步、机舱等场景的不便。后者则是国内首创,即使手机被恶意关机或断网,也能通过低功耗蓝牙广播技术实现精准定位,极大提升手机丢失找回的几率,为用户安全与财产保驾护航。
04
安全隐私
小米一直将用户的数据安全和隐私保护视为我们的生存之本,自产品设计之初便深植隐私与安全设计理念。我们遵循“最小必要、透明可控、安全保障”的原则,依据STRIDE威胁模型进行安全设计,通过应用、系统、硬件三层纵深防御,加之SDL安全流程的嵌入,全方位守护用户数据安全。
▍数据安全
在数据安全领域,Xiaomi HyperCore国内首发端到端加密技术,为云服务数据提供业内最高等级的保护。相较于传统云服务将密钥保存在云服务器上的方式,端到端加密将密钥置于用户端侧,确保数据掌控权始终在用户手中。
这种技术不仅提升了数据安全等级,还改变了传统的数据鉴权方式。有别于业内通过账号和密码来鉴权同步数据到的方式,使用高级数据保护后,加密数据只能在用户信任的设备上被解开。即使账号密码泄漏或服务端被攻破,用户数据也不会泄漏,因为内部人员也无法读取加密数据。
同时,加密的密钥是通过用户的PIN码进行保护的,进一步增强了安全性。用户可以通过锁屏密码、信任设备的验证码或恢复密钥来恢复自己的数据,但需要牢记自己的口令。如果忘记口令,就连小米亦无法帮助用户恢复数据。
▍端侧安全
端侧安全方面,小米自研的MiTEE硬件级底层安全系统,是设备安全的坚固基石,其独立运行,与主系统隔离,为存储生物认证信息及机密进程提供了安全环境。MiTEE支持多种安全隔离架构,从高性能设备的Trustzone、Hypervisor隔离架构到轻量设备的Trustzone隔离架构,实现灵活部署。并通过CCRC EAL5+高等级认证,安全性能卓越。
基于MiTEE的硬件级安全,Xiaomi HyperCore还为上层应用提供了安全隔离环境,特别加固了金融和支付安全,采用了新的高级数据加密密钥,增强了数据保护。同时,小米还向第三方开放了“安全相机”接口,三方应用可以获得带有证书链及签名的图片,鉴别图片是不是来自于真实的设备,提高人脸识别相关业务场景的安全级别。
除此之外,小米澎湃OS 2还推出了通行密钥身份认证技术。以先进、便捷的跨设备生物识别技术替代传统账号密码登录。在系统被入侵的情况下,传统的账号密码输入方式存在被监控的风险,而通行密钥身份认证技术则基于无密码登录标准/规范,将指纹信息保存在TEE中,实现硬件级隔离。同时,这一技术还带来了更便捷的使用体验,用户无需输入账号密码,只需通过指纹一键认证即可登录,并支持跨端使用。小米同样向第三方开放了相关接口,以推动这一技术的广泛应用。
小米澎湃OS 2以全面、深入的安全设计,结合前沿的加密与生物识别技术,为用户打造了一个安全、可靠、便捷的操作系统环境,让数据安全与隐私保护成为小米澎湃OS 2的坚实后盾。
05
Xiaomi HyperCore开发之路
在Xiaomi HyperCore这一里程碑式的成果,背后是对于基础体验的极致追求。为此,我们成立了由超过3000名工程师组成的专项小组,横跨硬件、软件、测试、市场及用户体系等多个部门,这个团队不仅重构了高压测试模型,更针对多达25000个真实使用场景进行了详尽的分类与甄别,并逐一攻克了其中的技术难题。同时,为了确保底层技术的稳健落地,每一项底层技术落地都必须完成超过1000项的测试用例。
在这个过程中,Xiaomi HyperCore被精细拆解为280多个子系统,并为此成立了305个专项小组,其中,有52项技术在行业内处于绝对领先地位,并在整个研发过程中还产生了200多篇专利。这些专利不仅是技术创新的见证,更是小米澎湃OS 2未来竞争力的坚实基石。
而面对如此庞大的系统工程,专项团队亦展现出了非凡的组织能力与执行力,建立了缜密严谨的工作流程,从每个子系统的技术战略规划(TSP)制定,到多轮严格的专项评审,每一个环节都力求科学、严谨且规划先行。同时,团队还打造了专项管理平台,实时监控着各项专项的进展情况,确保整个研发过程能够按照既定的计划稳步前行。最终铸就了小米澎湃系统内核Xiaomi HyperCore。
-
小米澎湃OS 2,不仅是小米技术创新历程中的一座里程碑,更承载着小米对极致用户体验的不懈追求,通过自研的Xiaomi HyperCore,系统在性能提升、图像处理、网络优化和安全防护四大核心领域取得了显著突破,为用户带来了前所未有的流畅操作与稳固保障。同时小米也将正逐步开放小米澎湃OS的相关能力,鼓励更多的开发者、合作伙伴加入这一生态,共同推动智能科技的进步。
截至目前,小米已组建了规模庞大的研发团队,人数高达20436人。同时,公司在全球范围内累计获得超过4.1 万件专利。小米将始终坚持以技术为驱动,不断突破自我,引领行业创新,致力于成为全球硬核科技领导者。随着小米技术的不断开放与升级,我们相信未来的智能生态将更加丰富多彩,用户将享受到更加便捷、智能、安全的生活体验。
END