小米AI 连接智能生活

本文介绍了小米在AI领域的最新进展,包括AI视觉、AI声学语音、自然语言处理和知识图谱。小米AI实验室在图像处理、语音识别、机器翻译等方面取得了显著成就,打造出便捷的智能生活体验。例如,AI视觉技术在手机相机中实现HDR、超级夜景等功能,AI声学语音技术让小爱同学成为领先的语音助手,自然语言处理则推动了跨语言沟通和人机对话的发展。
摘要由CSDN通过智能技术生成

近年来,人工智能(AI)技术在多个领域落地并不断取得发展与突破。在互联网的推动下,AI语音助理、智能家居、眼镜相机等产品相继推出,打造了更加便捷的生活体验。

秉承着“技术为本”的理念,小米始终致力于前沿技术的探索。2016年,小米正式成立AI实验室,覆盖计算机视觉、语音声学、自然语言处理(NLP)、知识图谱、机器学习等多个研究方向。曾获百万美金技术大奖的Cyberdog铁蛋仿生机器人就融入了计算机视觉、自然语言处理和声学语音等多项AI技术。

那么,什么是视觉AI技术呢?小米的AI技术又有哪些新进展?让我们跟随小米AI实验室主任王斌、声学语音技术总监王育军、语音首席科学家 Daniel Povey一起走进AI技术。

01

AI视觉

AI视觉主要研究方向包括图像、视频的处理和理解,人脸、人体算法等。小米技术团队重点研究了手机相机的基础画质算法、图像视频的智能编辑、识别和理解。

  1    硬核算法,助力手机影像

近年来,小米AI实验室陆续为小米手机贡献了HDR、超级夜景、万物追焦、AI相机、单摄人像模式、美颜、人脸解锁、人脸相册、魔法换天、智能挑片、照片文字搜索等多个重点功能的核心算法。这些算法为相机系统架构“小米影像大脑”提供了强有力的技术支撑,其中,HDR、人像超清、边缘画质提升等技术曾助力小米手机3次登顶DXO。

678272afc6a90ba43f5ed8df25c92e10.jpeg

“超越人眼,感知人心”是小米提出的全新影像理念,让用户通过快门记录每个感动人心的瞬间是小米一直以来的愿景,而AI使这变得更加容易。例如,打开相机后,AI场景检测就会判断用户所处的场景是白天还是夜晚,室内还是室外。按下快门,HDR、超级夜景等算法会通过不同参数智能化地对当前场景进行处理,进而拍摄出适宜的动态范围、明暗对比强烈且细节细腻的照片。在小米全新影像理念背景下,HDR、超级夜景、AI场景检测等算法助力徕卡双画质,在手机上赋予用户单反级相机的影像体验。

0a018b1c82d92594ca471c23e1888973.jpeg

基于计算机视觉技术打造的“万物追焦”功能可以自动识别和聚焦人、猫、狗等动物,并针对不同拍摄距离进行焦点实时跟踪,随手一拍都清晰。“万物追焦2.0”在追焦1.0的基础上进行了大量功能更新,加入动物、花朵等多类目标的精准识别对焦,目前已在 Xiaomi 13系列、Redmi K60系列落地。

6b271efd1dd438ab78af20cccae59007.png

  2    所见即所得,高效办公“神器”

为普通用户带来更好的科技体验与便捷应用,实现“科技向善”,是小米视觉的技术愿景之一。除了影像画质,AI视觉还涵盖了多种实用功能。基于深入的用户调研,泛文档类对象是小米用户的核心拍照场景之一,通过前沿的对抗生成网络技术、三维模拟建模等AI技术,小米视觉逐渐落地了包括超级文档、AI去影、畸变恢复、手写消除、终端实时文字提取、表格识别等多个功能。

值得一提的是,终端实时文字提取、表格识别、手写消除等多项功能,最近在小米新系列机型先后上线,提升了小米手机商务应用方向的产品竞争力。其中,表格识别技术一经推出,就成为了日常办公中的“神器”࿱

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值