7月30日学习笔记
目标定位
分类与定位 通过神经网络输出一个分类结果和四个参数值表示目标在图片中的位置
标签y pc表示是否有这个对象 bx by bh bw 分别对应目标的位置参数,c1 c2 c3表示目标的分类。
特征点检测
通过人为的添加特征点,通过特征点的检测可以判断人物的表情、动作形态等等。
目标检测
滑动窗口目标检测算法
以固定的步幅遍历整个图像的每个区域,把这些剪切后的小图像输入卷积网络,对每个位置按0或者1分类
缺点:计算成本
将全连接层转化为卷积层
公有区域可以共享很多计算,直接对整个图片进行卷积,一次得到所有预测值
Bounding box 预测
yolo算法 通过自己划分格数,将对象分配到自己所划分的格子内,卷积实现。
约定bx by在0到1之间确保在这个格子内。bh bw可以大于1