三井 发自 凹非寺
量子位 报道 | 公众号 QbitAI
这是一个发布新手机必谈AI的时代。
也是一个需要测过才知道AI行不行的时代。
前不久,华为发布了新一代旗舰手机Mate 20系列。配备AI芯片麒麟980,双NPU,号称六项业界第一。
而且,余承东还在发布会上“秀了”好多好多AI驱动的功能。比如:
能够实时分离视频中的背景与人物;
手机扫一下测出食物中的卡路里;
实时翻译数十种国家的语言;
语音助手“小艺小艺”无所不能;
等等等等。
实际中怎么样呢?
最近,量子位拿到一部华为Mate 20 Pro,对其AI能力进行了测评,希望能够给你带来一些参考。
测评设备的基础配置是:8G+128G,EMUI 9系统。
整个测评围绕着AI展开,有AI性能测试和日常任务测试两个部分。
日常测试的内容,基本与华为在宣传和发布会上提到的功能对应,以便进行对比。
在测评中,量子位发现,华为在发布会上吹过的牛,基本上都能够实现,当然在实际效果上,买家秀和卖家秀还是有所差别。
以下就是我们的上手实测~
先来跑个分
在智能手机领域,一直流传着这么一句话:不服跑个分。
测评手机的AI能力,自然需要用有AI特色跑分程序。
前一段时间,瑞士的苏黎世联邦理工学院开发了一款应用,名叫 AI Benchmark ,就是专门用来测试安卓设备以及芯片的AI性能。
通过各种手段,我们从Google Play上下载到了这款APP。
整个跑分过程大概持续了8分钟,跟平常使用的跑分软件需要的时间差不多。
△跑分过程一瞥
结果出来之后,让我们有些意外:14442分,随后,又进行了几次跑分,基本上都在14000分以上,最高的达到了14475分。
Benchmark官网上也有Mate 20 Pro的跑分成绩,才12047分。
原因是具体的配置有所不同,我测评的设备运行内存8G,官方测评的设备只有6G。
看来,运行内存对于手机的AI性能会有影响。
根据官方介绍,AI Benchmark测试的是手机运行一些深度神经网络算法的能力。
测试中执行的任务主要有图像分类、人脸识别、图像去模糊、图像超分辨率、图像语义分割、图像增强、内存极限测试等等。
大部分都是与图像识别与处理相关的任务,也是目前手机中应用比较多的。在接下来的测评中,也会有所提及。
需要注意的是,跑分只能够体现手机在硬件上对AI任务的支持程度,体现的是手机硬件AI性能的表现。在日常生活中完成一些任务时效果怎么样,还需要进一步的测试。
日常任务测试
在Mate 20系列产品发布的时候,有个功能让很多人都感到惊艳:
这是发布会上展示的一段手机视频,黑白背景里,跳舞小姐姐和她的红裙子非常引人注目。
保留人物的全部色彩,把背景的颜色都去掉,这种细致耗时的后期处理工作,全被搬到了手机上实时完成。
这一部分,就从这个功能开始。
AI摄像&拍照
其实,我们也很想找个小姐姐跳舞测试,但人、一直找不到。只能抓个壮丁来走两步进行测试了。
大家就勉为其难,看下这个“土味儿”的测评吧。
打开相机,调到录像模式,点左下方的“魔棒”状按钮,选“AI色彩”,就可以开拍了。
具体的入口位置如图所示:
前方高能!“土味儿”警告!
整体上来看,效果还不错。但如果速度够快,色彩就追不上了。
要实现这个功能,首先要分离人物与背景,跑分任务里的“图像语义分割”就是用来做这个工作的,如果发现分割出来的主体是人,就在黑白背景里,保留“人”这个区域的色彩。
猫狗小金鱼什么的,就不会保留颜色了,不过我们在测试的时候发现,只要勉强有人样,就会保留颜色。比如说,葫芦娃。
背景虚化实现逻辑也大致一样,只是分割之后对背景的处理方式略有不同。
在视频中,识别动态人物的方式相对多一些,比如,还可以通过前后几帧的对比来确认人物。但也会给设备的性能提出更多的要求。
类似的效果,在拍摄静态照片的时候当然也有。
“咔”的一下,整个人就被扔到了教堂里去了,还有阳光透过五彩斑斓的窗户洒了进来。
但,抠图的痕迹还是有点明显,毕竟使用算法,会受到各种环境因素的影响。不过已经比我用过的大部分类似软件都好了。
这是Mate 20相机“人像”模式里的一个小功能,开关就在正中间。
想实现这个功能却有不少限制:需要现拍,还要离人近,对准脸。
除了给视频、照片创造出各种戏剧化效果之外,这款手机还围绕着相机,做了很多AI实用功能。
智能识物
余承东在发布会上演示的测试食物卡路里的功能,就是智能识物的一部分。
测测卡路里
使用这个功能,需要先打开相机拍照界面,点左上角的一个“小眼睛”图标。
进去之后,再选“识物”。隐藏得挺深。
当把一切都准备就绪之后,正好有的一位同事正在吃包子,就把她的包子“借”过来测了一下。
结果还算准确,而且还能“目测”估算出来这些包子有多重。
橘子苹果测试结果:
炸酱面:
结果就不对了,成了一碗大拌菜。这也能理解,因为这看上去很像大拌菜。人用肉眼识别起来都有麻烦,交给AI去识别,就更懵逼了。
如果真的准了,这部手机的AI能力,也就非常成熟了。
不过,用手机测卡路里,只是提供一个参考,如果想要用这个减肥……还是算了,估测的准确度暂且不说,就算是一个包子,它都能拍的白白嫩嫩的,谁能忍住?
测卡路里,只是这个“识物”功能的一方面,当你把摄像头对准其他物体的时候,就能发现它还有很多功能。
真·智能识物
智能识物这个功能,断网是用不了的。具体的实现方式应该是通过摄像头捕捉图像,然后在云端识别,再进行处理,反馈结果。
而且,这个功能也会受到图片背景复杂度以及识别对象的种类的影响。
比如,识别衣服成了狗,人成了一个商场。
有的时候,甚至都识别不出来,然后就给了一个汽车之家。应该是把识别对象当做了汽车。
在处理复杂图像的能力上,算法的确很难处理到位。还有待提升。
不过,也有很厉害的时候,比如下面的绿萝和万年青就识别的很精准。
从上面的几个测评结果中可以看出,识别不同种类的对象,Mate 20 Pro会使用不同的“引擎”。
对于大部分物品,它用的都是百度识物。对于某些细分的类别,会选择专门的引擎,比如植物的“花伴侣”、汽车类的“汽车之家”、以及识别食物计算卡路里专用的算法,等等。
商品搜索购物
商品搜索购物,和某宝等电商App的以图搜图、以图搜商品就差不多了。无论是对于手机厂商还是对用户来说,这都是个很实用的功能。
Mate 20 Pro默认的搜索引擎是淘宝,也可以选全球购,里面有当当、考拉以及寺库等电商平台的商品推荐。当识别数码产品的时候,会默认出现华为电子商城推荐华为的产品。
功能入口在识物旁边,如果图片已经在手机上了,还可以通过双手按压图片进入搜索购物的界面。只要你敢拍,敢按,就会有结果出来,但准确性……还有待提升。
比如,墨水认成了眼影和指甲油,但大体看上去还挺像。
在看图搜商品最常用的品类:衣服上边,这款手机搜索淘宝同款效果还是很好的,一下子就在淘宝上找到了同款的毛衣。
但是作为半只脚踏进AI圈的人,怎么能只搜衣服呢。有人给我们出了一个主意,让测一下手机。
大家猜,这个手机到底是哪一款?猜出来的评论区见。
实时翻译&文档提取
说到翻译,也是华为手机比较重视的一部分。在产品的发布的预告片中,就放出了风声,称可以“秒懂多国语言”。在发布会上,余承东也展示了强大的语音实时翻译能力。
但是,语音实时翻译只有保时捷版才支持。
我们测评的这款Mate 20 Pro只能用到“AR翻译”,即通过摄像头实时对目标物体进行识别,提取文本给出翻译结果。
在发布会上也提到了“AR翻译”的功能,当时是一个外文菜单。从效果上来看,也还可以。
但实际效果,还有待完善,偶尔……会乱入一些东西。
放到平面上识别一份文档,效果还不错。
文档识别功能跟“识物”集成在了一起,如果检测到的是文档,就会自动切入提取文档的界面,然后对识别到的文档进行分词处理。
好吧,看来我们对AI的要求有点苛刻了,上来就让它看论文,要求的确是很高。对于翻译一些日常的说明书,效果还行。
图像方面的测试到此结束。下面开始测试它的语音识别能力。
AI语音助手
华为的语音助手默认唤醒词是“小艺小艺”,从原来的小E演变而来。
在国内的发布会上,余承东专门花了一段时间介绍这项服务,而且还发布了智能音箱,看来华为这次是来真的了。
因为起步较晚,而且一直没有受到重视,在数据的积累上,华为明显落后了不少。
在测评的过程中,能够清晰地感受到,在Mate 20 Pro上,虽然具体的唤醒、以及识别语音命令比较流畅,但多少有点凝滞感。
不过,使用语音助手完成一些日常的任务,比如定闹钟、发微信、发QQ等等,是完全没有问题的。在发布会上提到的驾驶模式,因为条件有限,就没有进行测试,大家如果有条件测试,欢迎分享一下。
不过,友商有的毛病,它也有。
在默认是“小艺小艺”的情况下,如果我喊“小鹰小鹰”,它也会应答。
如果你喊小爱同学“小白同学”,喊Siri“Sihei”,它们也会响应你。
有兴趣可以试试~
小结
整体上来说,华为Mate 20 Pro,算是一个目前AI技术的集大成者。
芯片上,有麒麟980加持,跑分表现的确不错。在具体的应用上,针对不同的场景,选择了做得比较优秀的引擎,并且在系统层面上进行了集成,的确是一个不错的处理办法。
虽然在实际测评的过程中,也有不少“智障”行为。但从AI发展目前所处的阶段来看,这也是比较正常的,毕竟要尊重历史进程。
需要注意的的是,一部手机的AI能力,并不仅仅限于表面的应用上,也会体现在系统的设计中以及手机实际的使用体验中,而这些只能大家自己感受了。
还有一个遗憾
此外,这次测评中,还有一个遗憾,能够复活手办的3D建模没测成,好多同事大胆的想法都没有得到实现。
经过查询后才知道,相应的应用只有等到11月之后才能在应用商店下载,具体几号,还不太清楚,截止发稿前,还没有上架。
到此,我们的测评也就结束了。
你觉得这款手机的AI怎么样呢?
— 完 —
加入社群
量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)
活动策划招聘
量子位正在招聘活动策划,将负责不同领域维度的线上线下相关活动策划、执行。欢迎聪明靠谱的小伙伴加入,并希望你能有一些活动策划或运营的相关经验。相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态