1、第一种是滑动窗口,但是形变大的目标不适合,运算量太大;
2、区域建议:R-CNN系列
即RPN+CNN,其中RPN负责选出图像中可能的目标区域然后输入CNN进行分类;
3、Anchor Box:其特点是一个窗口只能检测到一个目标,多个尺度
anchor box只需预测:类别标签、偏移量
anchor box的选取可以有人工选取、K-means聚类、作为超参数让网络学习;
另外在训练阶段和预测阶段均有anchor box
1、第一种是滑动窗口,但是形变大的目标不适合,运算量太大;
2、区域建议:R-CNN系列
即RPN+CNN,其中RPN负责选出图像中可能的目标区域然后输入CNN进行分类;
3、Anchor Box:其特点是一个窗口只能检测到一个目标,多个尺度
anchor box只需预测:类别标签、偏移量
anchor box的选取可以有人工选取、K-means聚类、作为超参数让网络学习;
另外在训练阶段和预测阶段均有anchor box