1.物体识别
- 深度学习之前:尺度不变特征变换方法和支持向量机等机器学习方法组合应用;
- 2012年:多伦多大学研究团队提出CNN、ReLU、DropOut的使用,可以自动捕捉到多个方向的边缘和颜色渐变、网纹图案等;
- 2013年:反卷积网络的提出,可以恢复卷积结果,直观确认训练后网络的好坏;
- 2014年:深度神经网络的提出,22层的GoogleNet和19层的VGG。
2.物体检测
确定图像中物体的位置的方法。
分类:
- 事先限定检测对象:人脸检测、行人检测;
- 非类别限定
对于非类别限定的物体检测,使用区域神经卷积网络R-CNN实现,一些问题和解决方法如下:
问题1:如何筛选候选区域
- R-CNN通过selective search分割方法从图像中提取候选区域;
- 再将候选区域作为CNN的输入。
问题2:如何去除冗余的候选区域
- 迁移学习
- 首先使用ImageNet数据集进行物体识别网络训练,再把训练好的网络参数作为其它网络参数初始值进行微调;
- 通过CNN提取特征,通过SVM进行识别。
3.分割
输出每个像素所属类别的方法。
4.回归问题
应用:面部器官检测和人体姿态估计
训练时使用最小二乘误差函数,通过级联网络提高估计的准确率。
步骤:
- 使用针对整个脸部区域的网络和针对特定区域的网络分别检测;
- 初步估计各器官大概位置,独立估计各器官的位置,具有很好的稳健性;
- 针对各器官进行详细位置的估计。
5.人脸识别
- 人脸对比:基于二值模式,捕捉到的人脸图像与已认证的作对比,核实是否为同一人;
- 人脸认证:类别识别,从已登记人员中找到识别到的对象,登记规模越大,识别难度越高。