CV入门学习整理集合
目标检测
yolo系列
yolo v1
论文地址: http://arxiv.org/abs/1506.02640
作者:Joseph Redmon
图片来源:精读AI论文系列https://www.bilibili.com/video/BV15w411Z7LG?p=3&spm_id_from=pageDriver目标检测有两派,单阶段(端到端)YOLO、SSD、Retina-Net 和多阶段RCNN、SPPNet、Fast RCNN、Faster RCNN
单阶段:直接输入图片,同时输出分类和框
两阶段:耗时长,精度高
预测阶段(此时模型已经训练好):
1.图片分为7*7 grid cell
2.每个grid cell 预测两个bounding box (具体判断为bound ing box 中心是否在grid cell内)每个bounding box含5个参数中心坐标x,y 长 宽 置信度
mean average precion (mAp) 解释 link.
- 快 :45 frames per second
- 分析全图的信息 : 把背景误判成信息错误少(可以对不同类别间学到信息进行隐式编码—如学到人在自行车上的信息)
- 迁移能力强
- 有一定的识别误差 — 尤其是小物体
定位误差比较大
激活函数
optimize:平方和误差
没懂:
NMS(未懂)
L2正则化
学习率