electech6的博客

本人微信公众号:计算机视觉life(CV_life),关注计算机视觉、机器学习、人工智能...

未来智能手机摄像技术发展趋势:应用

本文已经首发在个人微信公共号:计算机视觉life。


最近几年手机摄像头的分辨率越来越高,目前最高可以达到几千万分辨率。这对于大部分的拍照场景其实已经足够。早先的手机摄像技术主要关注如何呈现更清晰的画质,如何把人物拍的更好。随着摄像头硬件的发展逐渐进入成熟期,笔者认为手机影像下一步发展的重点就是如何更加有效、有趣地使用好这些图片和视频。未来手机摄像技术的发展将越来越重视两个因素:计算机视觉算法和人工智能


下面结合计算机视觉技术和人工智能的发展趋势,从个人的角度预估一下即将爆发的以及未来可能出现的一些应用场景。


1、实时三维空间应用


当智能手机的深度相机发展起来后,就可以实时获取比较精确的环境深度图,这将会解锁一大批三维相关应用,比如空间测量、人体三维建模、大场景实时三维重建等。


比如你在艺术馆看到一座非常喜欢的雕塑,就可以利用手机对它扫描一周,结合相应的算法就可以生成该雕塑的三维模型数据,利用三维打印机就可以方便的打印出一个三维的雕塑复制品出来。



而大尺度实时三维重建的应用更广,可以广泛用于机器人自主导航、无人机侦查、古建筑保护、建筑设计等场景。其中最有可能先发展起来的就是机器人自主导航,目前基于RGBD相机的SLAM(即时定位与地图构建)技术是主流研究方向。




2、三维立体美颜美体


美颜一直是手机用户(尤其是女性用户)的一个刚性需求。现在磨皮、瘦脸、美妆已经是大部分女生发自拍照的标配。


前段时间美图推出的“一秒变手绘”已经在朋友圈火了一把。据官方介绍该手绘特效技术基于人工智能深度学习技术,并融合人脸识别、美颜技术、头发渲染等多种技术,过去传统画师用几天时间才能绘制的手绘画像,机器学习可以一秒钟就满足用户的需求。下图就是手绘的效果图,不得不承认效果非常赞。




目前图片美颜技术已经比较成熟,视频美颜处于初级发展阶段,目前比较流行的就是美拍的face sticker功能,如下图所示。虽然只是对视频增加了一些小小的饰物和特效,但是很多女生已经彻底离不开它了。足见用户对美颜的需求是多么的旺盛。


但是你以为这就可以满足爱美的女生了吗?


图样图森破,她们对美的追求是永无止境的,他们需要的是360°无死角的美!当手机摄像技术结合了实时三维深度信息后,未来美颜也将美出新高度:三维立体美颜和美体


三维美颜和美体是对二维美颜的全面升级,当二维图片美颜日趋成熟时,美颜的主战场将进入视频领域。由于能够实时获取较精准的三维空间信息,对人的五官轮廓建模将会变的比较容易。基于视频的三维人体瘦脸、嫩肤、隆鼻、双眼皮、美发等三维美颜统统小菜一碟,而像丰胸、A4腰瘦身、优化身材比例等这种全方位立体化的美体技术也会大量出现。这些将在视频聊天、视频直播、影视制作等场合有较多的应用。



未来的美颜技术核心是能够在美颜的同时保持个体的独特特征,不会美的千篇一律,要有真实感。想一想将来不需要化妆、不需要整形,就能在视频里呈现出天使一般的容颜和魔鬼一样的身材,这个市场一定大的惊人。


3、三维人脸活体识别


今年央视315晚会上,人脸识别技术被曝存在安全隐患。主持人在现场技术人员支持下,仅凭两部手机、一张随机正面照片及一个换脸APP,分别就一张”眨眨眼”的照片和一段”活体检测”场景模拟,成功“攻破”人脸识别系统。


目前人脸识别技术常见的攻击方法有:PS换脸、屏幕翻拍、戴面具、建模驱动等。


而传统的人脸活体检测一般通过指定用户的动作来作为防伪线索,例如:眨眼、张嘴、点头、摇头、微笑等动作。这种方法存在一定的漏洞,正如315晚会所示,该方法难以防止真人视频翻拍或者换脸算法合成的视频的攻击。


315晚会后不少高科技公司(如百度、腾讯、旷视科技、商汤科技等)都第一时间从自己技术方面进行了回应,号称可以规避这些风险。但是笔者总结了一下他们的解决方案,基本都是使用更加复杂的随机唇语、语音图像同步检测、人脸纹理分析、面具检测、视频防翻拍等多维度防护手段,并将所有这些手段进行交叉融合来实现防护的。这些在当下可能确实起到一定防护效果,但是笔者认为道高一尺魔高一丈,这些是治标不治本的方法。看看下面这个例子就知道了。


2016年美国斯坦福大学的研究团队研发出一款人脸跟踪软件Face2Face,它可以通过摄像头捕捉用户的动作和面部表情,然后该软件可以驱动视频中的目标人物做出一模一样的动作和表情,效果极其逼真。你可以控制普京这样大人物在视频中做出任何你想要的表情,像这样:



这种黑科技做的简直天衣无缝,连我们人类都能轻易骗过。可见人脸验证防伪工作任重道远。


不过,笔者认为基于三维空间的人脸活体检测或许可以从根本上改善这一现象。因为目前所有的防伪验证摄像头采集的都是二维图片/视频信息正是由于缺失了最重要的空间信息才使得各种合成的图像或视频有了可趁之机


笔者认为未来的三维人脸活体识别技术除了使用传统的RGB相机采集信息外,还会增加深度相机。不管你合成的图像或视频多么逼真(比如Face2Face),它只能在屏幕上以二维的影像显示。缺失了空间信息,注定是无法通过三维人脸活体检测的。


4、更丰富真实的AR体验


未来借助手机摄像头和手机屏幕,结合地理位置定位、计算机视觉、大数据等技术可以轻松便捷的实现手机上丰富多彩的AR(扩展现实)体验。在此列举几个。


(1)更真实的游戏体验

结合了实时三维信息的AR游戏形象能够感知周围环境,它能够感知高低、远近、前后景等实景信息,从而可以做出遇到不同高度平面边缘跳跃,躲藏到障碍物后面等一系列非常真实的效果。也许以后隔着手机屏幕你都无法分辨真实世界和虚拟世界了。




(2)更便捷的出行指南

比如未来我们到一个陌生的地方,需要寻找餐厅、咖啡馆甚至厕所,不需要再像以前那样麻烦了,直接掏出手机,打开摄像头对着街道,会自动出现如下的AR内容介绍,妈妈再也不用担心我找不到地方啦!




(3)更高效的教育培训

基于智能手机的AR可以用于课程学习、操作培训,降低学习和工作的成本,提高学习工作效率和安全性。以后学习一项新的技能将会越来越容易。




(4)更丰富的广告传媒

AR 技术可以在传统纸质图书、墙纸广告、美术馆展品等平面图像上叠加虚拟信息,在手机屏幕上可以看到对应的视频、背景信息等扩展内容,带来全新的阅读、观赏体验。




(5)更便捷的空间应用

将三维测量、三维模型和AR结合起来会产生更多的玩法。以家居装修为例,具备了三维测距功能的手机可以对房屋空间尺寸实时测量,利用家具厂商提供的每个家具的三维空间模型(包括物理尺寸、花纹、配色等),只需要用手机点一点,用户就能在手机屏幕上看到家具摆放在家里的真实位置和尺寸。而且AR呈现出来的家具都是三维的,用户拿着手机旋转角度,就可以看到这件家具摆放在家里的任何角度,就像真的家具摆在那里一样,从而判断该家具尺寸是否合适,装修风格是否统一等。以后买家具再也不用带着尺子量了,也不用担心买回去颜色不搭了。




5、更人性的人机交互

在此主要是指三维手势识别。三维手势识别与二维手势识别的最根本区别就是增加了一维的深度信息。目前的二维手势识别只能做到一些比较简单的操作,比如控制视频播放开始和暂停、浏览照片等。但是对于更加复杂的体育类游戏或者VR来说,目前的二维手势识别还不够。未来智能手机深度信息能够极大促进三维手势识别的普及和应用,这也许会带来比触摸屏交互更加接近人类方式的交互体验。



更多精彩内容请关注微信公共号:计算机视觉life


阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。违者必究。 https://blog.csdn.net/electech6/article/details/70198420
个人分类: 产业理解
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

不良信息举报

未来智能手机摄像技术发展趋势:应用

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭