深刻揭露步态识别的“谎言”（篇二：深度学习乱拳打进来）

最新推荐文章于 2024-05-05 21:43:10 发布

于仕琪（南科大）

最新推荐文章于 2024-05-05 21:43:10 发布

阅读量677

点赞数 2

文章标签：算法网络神经网络人工智能机器学习

本文链接：https://blog.csdn.net/u010670887/article/details/120245972

版权

本系列上一篇文章《深刻揭露步态识别的“谎言”（篇一）》提到，简单的步态能量图GEI特征统治了步态识别领域大约十年。每想到此事，我都十分汗颜，作为本领域的研究人员，让GEI“横行”十年，的确“失职”。

进入深度学习纪元，深度学习横扫了很多领域，步态识别也不能幸免。回顾几十年的机器学习发展，有时候觉得很有意思。我上世纪末进入大学，那个时候正是神经网络和一些AI算法式微的时间。我还记得，有位教授在办公室里，对着我们两个本科生，滔滔不绝的讲了半个下午“专家系统”，发表了很多看法。我的大脑里，除了留下了他的激情，其他混乱如麻。专家系统里的有限且简单的规则，如何表达大量的知识，如何处理无穷尽的情况？

我本科时还用C语言手写实现了MLP神经网络（全连接神经网络）。当时跟另外两个同学合作参加美国大学生数学建模比赛。三天三夜几乎没睡，拿到题目后就去图书馆查书（那时候互联网上信息极少），决定用神经网络解决比赛题目。从对神经一无所知到实现出来，并没花多少时间。很多时候我们觉得很难，就迟迟不敢下手，花了很多时间也不会。心一横牙一咬，原来这么简单。神经网络给我留下最深刻的印象是“训练过程太难收敛了”！花了很多时间用于选择各种参数，每次初始化参数不同都会导致完全不同的结果。这个经历让我视神经网络为不能用“玄学”。这个竞赛后来好像只拿了一个三等奖。现在回顾一下，当时我们采用的技术路线完全无问题，解题结果也不是太差，问题是出在写作上。等意识到自己写作能力有问题就是很多年后的事情了，所以现在只能通过写微信公众号文章练习写作。

进入二十一世纪，统计机器学习大行其道，搞研究，言必称SVM、AdaBoost、Decision Tree、Random Forest等，大家论文灌起水来比上世纪也更活跃了。在分类和学习算法之外，特征设计方面更是“炼丹炉林立”。SIFT算子是特征设计里的王者，大部分后续特征都或多或少地受SIFT启发。SIFT在1999年由加拿大教授David Lowe提出，他的ICCV1999论文只有一个作者，通篇几乎无数学公式，跟现在的顶会论文风格完全不同，是那么的“朴实无华”。

卷积让神经网络更容易收敛，加上大数据和GPU，2012年神经网络穿上“深度学习”的护甲重新杀回江湖，一通乱拳。一拳打入步态识别领域，步态识别准确率刷到新高[1]，我也赶紧灌了几篇。

步态识别里一个让人头疼不已的问题是角度变化，如下图，两个不同的人在相同角度下差异不大，但同一个人在不同视角下却差异很大，造成“类内距离大于类间距离”，非常难识别。我的团队尝试使用SPAE[2]、GAN[3]等方法去归一化视角变化。无论什么视角，都把数据转换到侧面标准视角。

深度学习初期的步态识别方法还是采用了GEI特征。在机器学习领域，有一条公认的规则“Garbage in, garbage out”。意思是说如果输入数据质量很差是Garbage，是很难学出好结果的。这里面蕴含的道理是，输入机器学习算法的数据很重要。要进一步提升识别准确率，步态特征必须变革。

这篇先写到这里，欲知后事如何，可关注我的公众号。

参考文献：

[1]. Z. Wu, Y. Huang, L. Wang, X. Wang and T. Tan, "A Comprehensive Study on Cross-View Gait Based Human Identification with Deep CNNs," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 39, no. 2, pp. 209-226, 1 Feb. 2017.

[2]. Shiqi Yu, Haifeng Chen, Qing Wang, Linlin Shen, Yongzhen Huang, Invariant feature extraction for gait recognition using only one uniform model, Neurocomputing, Volume 239, 2017.

[3]. Shiqi Yu, Rijun Liao, Weizhi An, Haifeng Chen, Edel B. García, Yongzhen Huang, Norman Poh, GaitGANv2: Invariant gait feature extraction using generative adversarial networks, Pattern Recognition, Volume 87, 2019