![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
目标检测
b站上的目标检测基础,只是笔记内容
é«
这个作者很懒,什么都没留下…
展开
-
YOLO-V5实现
数据增强的13种方法:1)rectangular:在同个batch里面做rectangle宽高等比变换,加快训练(同一个batch里面拥有自己单独的宽高比)2)色调,饱和度,曝光度调整,三者调整最终得到一个综合的结果3)旋转缩放retate_scale通过一个变换矩阵进行变化变换矩阵的(0,0)(1,1)控制缩放的程度;(0,1)(1,0)控制旋转的程度,当他俩互为相反数的时候就是顶角对应平行旋转;4)平移translate5)错切6)透视变换;7)翻转...原创 2022-04-04 22:44:35 · 944 阅读 · 0 评论 -
Attion机制
通道维度加入attion机制:就是对输入的feature maps的每一个通道加入一个权值,以此产生不同的重要程度;方法:让这个feature maps(H*W*C)经过一个网络输出1*1*C的参数这个参数乘到原来的feature map上的每一个元素就ok;网络:全局平均池化(1*1*C)->FC(FC中有x个神经元,就相当于将1*1*C的维度降为1*1*X)->ReLu->FC(升维)->Sigmoid...原创 2022-04-03 12:51:42 · 552 阅读 · 0 评论 -
YOLO - V2
一系列改进 1.Better :1)加入BN层;2)高分辨率:先在224*224训练,再再448*448上训练10个epoch,再再448*448上微调。3)ANchor机制:对数据集的框的高宽比进行k值聚类,聚为5类,用这5类生成bbox,而不是随机生成。4)...原创 2022-04-03 12:36:19 · 863 阅读 · 0 评论 -
YOLO - v1
先理解预测阶段:1)一个448*448*3的图像经过YOLO这个黑箱输出一个7*7*30矩阵;2)7*7*30的矩阵中的30维是5+5+20;5是预测的bbox的x,y,w,c;20是20个类别的条件概率;解释c:解释条件概率:它的意义是当bounding box认为当前box中有对象时,要检测的所有类别中每种类别的概率.3)对于每一个1*1*30中第一个c乘20维的条件概率,得到20个类别的全概率;每一个1*1*30的向量能得到2个20类别的全概率;49个grid cell 就..原创 2022-04-02 00:10:11 · 3066 阅读 · 0 评论 -
yolo-v2
对yolo-v1(定位性能,recall,小目标和密集目标差)的改进:Better:1.加入BN层2.高分辨率分类器,先在224*224上训练,再在448*448上(因为没了FC层,加上了全局池化层,所以没有了图像的尺寸的限制)训练10epoach,再在448*448上微调。3.加入了anchor机制,通过k值聚类对原始的图像的bounding box的高宽 比进行聚类,分为了5类。对于grid改为了13*13的。大图片-速度慢-精度好,小图片-速度快-精度较低,因此可以通过输入不同的尺寸的原创 2022-03-29 17:23:35 · 2458 阅读 · 0 评论 -
yolo-v1
核心思想:就是每一个格子 预测两个候选框原因是对不同大小的bounding box预测中,相比于大bounding box预测偏一点,小box预测偏一点更不能忍受,因此对于y=根号x函数,x比较小的时候导数比较敏感,x比较大的时候不敏感。...原创 2022-03-29 12:34:52 · 1073 阅读 · 0 评论 -
目标检测指标计算
IOU:(交集和并集的比值)Precision(精度):Recall(召回率):准确率:所有的真/所有的情况。原创 2022-03-27 21:04:54 · 3497 阅读 · 0 评论