AI 大模型赋能手机影像,小米14 Ultra 让真实有层次

小米14 Ultra 首次引入AI大模型计算摄影平台Xiaomi AISP,实现AI超级变焦、Ultra Raw超级底片、色彩还原体系等革新功能。通过AI技术,Xiaomi AISP解决了传统计算摄影的诸多问题,如运动伪影、色彩失真等,提供更丰富、更自然的影像体验。同时,小米14 Ultra在人像摄影方面也有所突破,利用人像大模型实现主体与背景的深层融合,创造真实与美感的完美结合。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2月22日,小米龙年第一场重磅发布会,正式发布专业影像旗舰小米14 Ultra。

此前小米发布的两代 Ultra,在不同维度,引领了移动影像行业的走向。最新的小米14 Ultra 在定义的时候,我们反复在思考:怎么才能把移动影像推向一个全新的层次?

为此,小米跟徕卡、用户、摄影师、专家学者做了大量的交流,最终确定小米14 Ultra 影像追求的目标:让真实有层次,要细节丰富,过渡细腻;要主次明确,远近分明,通过好的技术和审美,还原生活的丰富、从而直指人心。

fae81692e8f10e246c26a2ae69243295.png

当 AI 大模型与手机影像结合,会碰撞出什么火花?

为了让基于 AI 大模型实现的手机影像系统更符合小米的“光学味”,在结合小米14 Ultra 的设计理念下,我们层次性地去释放大模型的能力,给用户带来突破性的效果和使用体验。

这里,要和大家重点介绍小米首个 AI 大模型计算摄影平台 Xiaomi AISP,也是小米影像大脑的全新升级。Xiaomi AISP 是计算摄影的强力之作,它有哪些革命性升级?我们一起来看。

d43d14c6c0902f06855b43399939fb2c.png


01 

Xiaomi AISP

首个 AI 大模型计算摄影平台

AI 大模型一经问世,便展现了其惊人的技术能力,各行各业都相继涌现出了利用 AI 大模型来推动技术变革的不同思路。小米相机团队也一直在思考,AI 大模型会给手机影像带来哪些变革?又如何将 AI 大模型技术更好地引入到手机影像系统里来?

经过不断地技术验证及效果评估,小米确定了开发基于 AI 大模型的 Xiaomi AISP 影像处理系统的目标,并在效果、算力、生成三个方面有了独家的见解和想法创新。

70f6986b273afcb2f8b8b90545bcd7ee.png

  • 效果:在图像领域,AI 大模型最初被用来生成描述包含各式内容、具有指定风格的图像。但随着技术的迭代,生成图像的质量、真实性、分辨率越来越高,甚至达到了影棚级的效果。

    若将大模型用到相机影像系统的任务中,处理噪声、影调、人像等问题,效果是不是会更好?团队带着问题开始尝试和探索,认为在具备一定质量的图像输入的前提下,经过合适的调整和匹配,AI 大模型会得到相较于传统方法或者第一代 AI 技术更好的效果。

  • 算力:算力,是将大模型应用到手机上、拍照影像系统里最大的问题。团队为了能将 AI 大模型应用到实时性要求非常高的手机相机影像系统中,在模型重构设计、模型求解优化(推理迭代)以及系统级管线管理及多硬件算法分配方面,投入了非常多的资源,也攻克了许多关键性的问题。

    通过重新设计、训练适合相机影像任务的小型化 AI 大模型,并基于小米澎湃 OS 和自研的异构加速平台,全面整合了 CPU、GPU、NPU 和 ISP 的平台算力(计算能力达到 60 TOPS),最终成功地实现了基于 AI 大模型的 ISP 系统解决了端侧、拍照模型运行的速度、功耗等问题。

  • 生成:为了让基于 AI 大模型实现的相机影像系统更符合小米的“光学味”,在结合小米14 Ultra 的设计理念下,我们层次性地去释放大模型的能力。在基础的影像功能任务和场景,从多个维度相对保守的使用了 AI 大模型的生成能力,以保持大模型原有的优势;相反的,在超出光学和传感器物理极限的场景,我们会适当释放大模型的生成能力,以带来不一样的效果体验。

本次推出的14 Ultra 所使用的 Xiaomi AISP 平台便是通过对效果、算力、生成的创新思考,基于 Stable Diffusion 模型(图像处理领域的基础 AI 大模型)开发。

依据相机影像功能间的耦合程度以及相机功能特点,小米将 Xiaomi AISP 拆分成四类大模型,即融合光学大模型、影调大模型、色彩大模型及人像大模型,并且各个模型都经过了小型化、异构并行等加速处理,以符合手机端侧、拍照功能客观需求特点。

经过这四类大模型不同的组合方式并结合影像处理流程的其他模块,实现了基于 Xiaomi AISP 的全新的相机功能,接下来让我们展开介绍。

27561e10e3c90616b19c0b4f34aa403c.png


02

AI 超级变焦

恢复超高清远景瞬间

清晰地捕捉动人瞬间,不受拍摄距离远近的影响,留住想要记录的真实。小米首次将 AIGC 技术应用到计算摄影领域,带来了能精准预测“看到什么”、“想要呈现什么样”的影像,解决相机中长焦功能拍摄距离远,成片效果模糊不清,缺少真实性的问题,并利用先进的 Stable Diffusion 大模型将其生成为图片的 AI 超级变焦(Ultra Zoom)功能。

以往 AIGC 往往使用在如魔法消除等后处理功能中,而如今应用在实时出图的功能中,小米走在了前列。可以说,Ultra Zoom 是 AIGC 在影像领域应用的革命性创新。

AI大模型能人形机器人可以被视为迈向通用人工智能的一大步。人形机器人是一种能够模拟人类外貌、行为和交流的机器,结合AI大模型的能力,可以实现更高级别的人工智能功能。 首先,AI大模型的强大计算能力和学习能力使得人形机器人能够更加准确地理解和模仿人类的动作和表情。通过对大量数据的学习,AI大模型能够理解并推断人类的情绪、意图和行为,从而更好地与人类进行交互和沟通。这种与人类的自然交流方式可以让机器人更好地融入人类社会,满足人类的各种需求。 其次,AI大模型能的人形机器人在应用领域具有广泛的潜力。例如,在医疗领域,人形机器人可以通过感知和理解病人的情绪和需求来提供情感支持和护理服务。在教育领域,人形机器人可以根据学生的学习情况和兴趣定制教学内容,提供个性化的教育体验。在服务行业中,人形机器人可以担任引导员、导游员等角色,为人们提供导航和咨询服务。 最后,AI大模型能的人形机器人还有助于推动人工智能技术的发展和创新。通过将大模型与机器人相结合,各种新的应用和功能不断涌现出来。同时,人形机器人的使用也可以促进对于伦理、隐私和安全等相关问题的讨论和解决。 总的来说,AI大模型能人形机器人是迈向通用人工智能的一大步。它能够实现更加准确和自然的人机交互,拓展人工智能在各个领域的应用,并推动人工智能技术的发展和创新。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值