目标检测
暄染落墨
这个作者很懒,什么都没留下…
展开
-
SENet讲解
卷积就是在卷空间信息,可通道信息也大不相同,有的通道信息重要,而有点通道信息是无用的。对特征图U的每个通道应用全局平均池化层(avg),可以得到该特征通道的常数标量。然后经过两个FC层得到C个权重系数,用此系数衡量特征图U的每个通道的重要程度,用该系数对特征图U进行加权。Squeeze 就是avg操作,表征该特征通道的全局响应。Excitation就是使用两个全连接层w参数进行不同通道之间的相关性学习。sigmoid函数是输出为(0,1)的函数,最终输出需要概率值。resnet中r值取16添原创 2022-06-09 16:31:37 · 539 阅读 · 0 评论 -
小样本目标检测(FSOD)之FADI代码解析
对基于迁移学习的小样本目标检测FADI代码进行分析原创 2022-06-09 14:27:29 · 982 阅读 · 0 评论 -
Python error “ImportError: No module named“
python原创 2022-06-07 11:13:35 · 465 阅读 · 0 评论 -
离线(无网络/内网)安装mmdetection全过程
参考链接 https://blog.csdn.net/weixin_43408415/article/details/109243846https://segmentfault.com/a/1190000041521916离线安装包的网址https://pypi.org/conda create -n mmdection python=3.8 -y通过https://pytorch.org/get-started/previous-versions/查看版本对应conda install pyt原创 2022-04-24 11:58:15 · 2625 阅读 · 0 评论 -
目标检测的边界框显示代码实现
数据集格式如下【标注的真差!!!Dataset/ArtificialLight/image-116.png, 845, 104, 104, 126, 929, 795, 104, 118, Dataset/ArtificialLight/image-117.png, 606, 250, 118, 127, 540, 93, 111, 106, 797, 167, 103, 121, Dataset/ArtificialLight/image-118.png, 751, 33, 132, 144, 30原创 2021-09-29 14:25:16 · 217 阅读 · 0 评论 -
注意力机制之注意力分数
目录注意力分数扩展到高维加性注意力scaled 点积注意力总结代码注意力分数注意力分数和注意力权重的区别:扩展到高维这里,q的数量和key-value对的数量可以不一致。q,k,v的维度都可以不同,最后得到的结果和v的维度一样。关键在于注意力分数a的设置。加性注意力h是超参数。Wk是从k映射到h维,Wq是从q映射到h。q,k,v这三个向量的维度可以不一样scaled 点积注意力q,k都是相同的维度,这里除以d还是为了减少输入长度的影响(类似于归一化)有多个query,这里,每一行表示原创 2021-09-16 09:07:57 · 4175 阅读 · 0 评论 -
coco数据集
目录结构├── coco2017: 数据集根目录 ├── train2017: 所有训练图像文件夹(118287张) ├── val2017: 所有验证图像文件夹(5000张) └── annotations: 对应标注文件夹 ├── instances_train2017.json: 对应目标检测、分割任务的训练集标注文件 ├── instances_val2017.json: 对应目标检测、分割任务的验证集标注文件 ├原创 2021-09-02 16:51:19 · 248 阅读 · 0 评论 -
分配算法之匈牙利算法
参考链接:https://brc2.com/the-algorithm-workshop/n个工人n份工作,一一匹配,每份工作只能被一个工作完成,每个工人只能完成一份工作,暴力破解的话,复杂度是n!。一个n*n的有权值矩阵,1.找到每行的最小值,每行的元素减去这个这个最小值2.找到每列的最小值,每列的元素减去这个这个最小值重复以下3个步骤(3-5):3.用最少的行线和列线去覆盖全部的零4.判断是否满足退出循环条件(若步骤3中线的数量等于行或者列元素的个数,则退出,否则继续)5.找到矩阵中不在原创 2021-08-31 17:37:51 · 191 阅读 · 0 评论 -
目标检测-SSD代码详解
目录读取数据集损失函数和评价函数网络模型图%matplotlib inlineimport torchimport torchvisionfrom torch import nnfrom torch.nn import functional as Ffrom d2l import torch as d2l#对每个锚框进行类别预测def cls_predictor(num_inputs, num_anchors, num_classes): return nn.Conv2d(num_原创 2021-08-02 11:09:37 · 1429 阅读 · 0 评论 -
感受野的计算
感受野是输出层的一个像素单元对应之前的输入层的区域大小。原始55输入图片,卷积核33,padding为1,strides为2.第一次卷积第二次卷积下图就是一个黄色的11感受野是绿色的77区域。有两个公式:计算输出的宽高:out = (in + 2p - k)/s +1计算感受野:F(i) = (F(i+1) -1) * stride + ksize (倒推的,F(i+1)是后面的特征层)...原创 2021-07-30 19:33:41 · 152 阅读 · 0 评论 -
目标检测数据集
目录下载数据集读取数据集自定义datasetdataloader读取一个iteration示例打印图片下载数据集%matplotlib inlineimport osimport pandas as pdimport torchimport torchvisionfrom d2l import torch as d2l#@saved2l.DATA_HUB['banana-detection'] = ( d2l.DATA_URL + 'banana-detection.zip',原创 2021-07-29 20:49:46 · 511 阅读 · 4 评论 -
多尺度目标检测
目录多尺度锚框多尺度锚框%matplotlib inlineimport torchfrom d2l import torch as d2limg = d2l.plt.imread('../img/catdog.jpg')h, w = img.shape[:2]h, wdef display_anchors(fmap_w, fmap_h, s): d2l.set_figsize() # 前两个维度上的值不影响输出 fmap = torch.zeros((1, 10原创 2021-07-28 19:15:21 · 232 阅读 · 0 评论 -
《动手学》-物体检测和数据集
目录1.理论2.代码3.QA1.理论边界框,有多种表示方法,左上右下,中心宽高,左上宽高三种数据集:COCO总结2.代码3.QAws√r 和 hs/√r,之所以是乘以r和除以r,是因为两者相乘,得到的是wshs,这样对于不同的s,得到的不同图像比例的框的面积是一样的。...原创 2021-07-18 22:27:44 · 88 阅读 · 0 评论 -
锚框分配算法详解,偏移量代码详解,nms详解
训练时,将每一个锚框视为一个训练样本。训练阶段,需要每个锚框的类别(class)和偏移量(offset),偏移量是真实边界框相对于锚框的偏移量。预测阶段,为图像生成多个锚框,预测锚框的类别和偏移量,根据预测的偏移量来调整它的位置以获得预测的边界框,最后输出符合特定条件的预测边界框。对于生成的锚框,计算得到任意一个锚框与所有的边界框的iou后,如何将真实边界框分配给锚框呢(也就是每一个锚框对应哪一个真实的边界框呢,或者对应背景呢),以下《动手学》写的真好,建议反复阅读。关于torch.max(in原创 2021-07-18 11:56:52 · 2730 阅读 · 9 评论 -
交并比的概念、代码详解
交并比的计算,此处参考《动手学》的代码,并做了详细的解释def box_iou(boxes1,boxes2): #boxes1:[boxes1数量,4],boxes2:[boxes2数量,4] #定义lambda表达式,计算矩形框的面积 box_area = lambda boxes:((boxes[:,2]-boxes[:,0])*(boxes[:,3]-boxes[:,1])) #计算锚框的面积,[boxes1数量] areas1 = box_area(boxes1) #计算原创 2021-07-17 21:05:50 · 919 阅读 · 0 评论 -
锚框生成算法、repeat_interleave,repeat区别
iou交并比0-1ws√r 和 hs/√r,之所以是乘以r和除以r,是因为两者相乘,得到的是wshs,这样对于不同的s,得到的不同图像比例的框的面积是一样的。代码import torchfrom d2l import torch as d2lfrom torchvision.transforms import transforms# 用于生成锚框def multibox_prior(data,sizes,ratios): # 把图像resize到300*400 transfo.原创 2021-07-17 16:07:30 · 393 阅读 · 2 评论