深刻揭露步态识别的“谎言”(篇二:深度学习乱拳打进来)

本系列上一篇文章《深刻揭露步态识别的“谎言”(篇一)》提到,简单的步态能量图GEI特征统治了步态识别领域大约十年。每想到此事,我都十分汗颜,作为本领域的研究人员,让GEI“横行”十年,的确“失职”。

进入深度学习纪元,深度学习横扫了很多领域,步态识别也不能幸免。回顾几十年的机器学习发展,有时候觉得很有意思。我上世纪末进入大学,那个时候正是神经网络和一些AI算法式微的时间。我还记得,有位教授在办公室里,对着我们两个本科生,滔滔不绝的讲了半个下午“专家系统”,发表了很多看法。我的大脑里,除了留下了他的激情,其他混乱如麻。专家系统里的有限且简单的规则,如何表达大量的知识,如何处理无穷尽的情况?

我本科时还用C语言手写实现了MLP神经网络(全连接神经网络)。当时跟另外两个同学合作参加美国大学生数学建模比赛。三天三夜几乎没睡,拿到题目后就去图书馆查书(那时候互联网上信息极少),决定用神经网络解决比赛题目。从对神经一无所知到实现出来,并没花多少时间。很多时候我们觉得很难,就迟迟不敢下手,花了很多时间也不会。心一横牙一咬,原来这么简单。神经网络给我留下最深刻的印象是“训练过程太难收敛了”!花了很多时间用于选择各种参数,每次初始化参数不同都会导致完全不同的结果。这个经历让我视神经网络为不能用“玄学”。这个竞赛后来好像只拿了一个三等奖。现在回顾一下,当时我们采用的技术路线完全无问题,解题结果也不是太差,问题是出在写作上。等意识到自己写作能力有问题就是很多年后的事情了,所以现在只能通过写微信公众号文章练习写作。

进入二十一世纪,统计机器学习大行其道,搞研究,言必称SVM、AdaBoost、Decision Tree、Random Forest等,大家论文灌起水来比上世纪也更活跃了。在分类和学习算法之外,特征设计方面更是“炼丹炉林立”。SIFT算子是特征设计里的王者,大部分后续特征都或多或少地受SIFT启发。SIFT在1999年由加拿大教授David Lowe提出,他的ICCV1999论文只有一个作者,通篇几乎无数学公式,跟现在的顶会论文风格完全不同,是那么的“朴实无华”。

卷积让神经网络更容易收敛,加上大数据和GPU,2012年神经网络穿上“深度学习”的护甲重新杀回江湖,一通乱拳。一拳打入步态识别领域,步态识别准确率刷到新高[1],我也赶紧灌了几篇。

步态识别里一个让人头疼不已的问题是角度变化,如下图,两个不同的人在相同角度下差异不大,但同一个人在不同视角下却差异很大,造成“类内距离大于类间距离”,非常难识别。我的团队尝试使用SPAE[2]、GAN[3]等方法去归一化视角变化。无论什么视角,都把数据转换到侧面标准视角。

深度学习初期的步态识别方法还是采用了GEI特征。在机器学习领域,有一条公认的规则“Garbage in, garbage out”。意思是说如果输入数据质量很差是Garbage,是很难学出好结果的。这里面蕴含的道理是,输入机器学习算法的数据很重要。要进一步提升识别准确率,步态特征必须变革。

这篇先写到这里,欲知后事如何,可关注我的公众号。

参考文献:

[1]. Z. Wu, Y. Huang, L. Wang, X. Wang and T. Tan, "A Comprehensive Study on Cross-View Gait Based Human Identification with Deep CNNs," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 39, no. 2, pp. 209-226, 1 Feb. 2017.

[2]. Shiqi Yu, Haifeng Chen, Qing Wang, Linlin Shen, Yongzhen Huang, Invariant feature extraction for gait recognition using only one uniform model, Neurocomputing, Volume 239, 2017.

[3]. Shiqi Yu, Rijun Liao, Weizhi An, Haifeng Chen, Edel B. García, Yongzhen Huang, Norman Poh, GaitGANv2: Invariant gait feature extraction using generative adversarial networks, Pattern Recognition, Volume 87, 2019

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值