1. 基本概念
1.1 视觉识别
视觉识别包含以下内容:
1)Image Classification
2)Object Detection
3)Object Localization
4)Instance Segmentation
5)Human pose estimation [Newell et al 2016]
6)Depth estimation [Laina et al 2016]
7)Segment proposal [Pinheiro et al 2016]
6)Depth estimation [Laina et al 2016]
7)Segment proposal [Pinheiro et al 2016]
1.1特征提取
特征提取:目前流行的方法是通过CNN来提取特征。
CNN网络越深,提取的特征越能表述目标的特征;CNN网络越深,就会遇到以下两个问题:
• 收敛问题(梯度消失或爆炸):可通过初始化优化方法和批量归一化方法(BN)来解决
• 准确度下降问题(网络越深,训练误差和测试误差越大):可通过深度残差学习(Deep Residual Learning)来解决
1.2 过拟合(Overfitting)
过拟合一直是DeepLearning的大敌,