清华大学的鲁继文等人[i]做了一个使用深度强化学习做的关于视频人脸识别的模型。将视频的注意力发现过程转化为马尔科夫决策过程,并通过深度强化学习框架训练注意力模型,不使用额外的标签。然而,视频人脸通常会出现不受控制的姿势、光照等变化,导致类内距离变大。一些特征会误导和混淆,使得低质量的帧可能会影响识别的性能。
要做的事情:
YouTube Video Faces是用来做人脸验证的。在这个数据集下,算法需要判断两段视频里面是不是同一个人。输入为两段视频,标签为匹配或者不匹配。
数据集:
YouTube Video Faces dataset: