目标检测
文章平均质量分 52
正在学习的浅语
这个作者很懒,什么都没留下…
展开
-
Pytorch已知一个tensor的索引,并对它进行重新排序
之前遇到了一个问题,我有一个tensor,它的形状是b c h w ,和与它一样长的一个索引 b c 1 1 。我们要根据这个索引对原始tensor进行重新排序。百度了一圈貌似没有直接解决的api,感觉只能用循环处理,因此我用循环写了一个函数来搞定这个问题。#第一个参数是原始要排序的tensor,和索引,返回排好序的结果。def sort_with_idx(source,idx): #根据索引对tensor进行排序 "source: b c h w , idx: b c 1 1"原创 2022-01-23 15:59:28 · 6607 阅读 · 3 评论 -
Windos cuda cudnn10.1 10.0 10.2免费下载
cudnn cuda对应10.2版本链接:https://pan.baidu.com/s/1m7jOwBcgHSwlNI7dIIV4Iw提取码:ogo9cudnn cuda对应10.1版本链接:https://pan.baidu.com/s/1flDyUOFeazSajNKS47zqnQ提取码:3o2fcuda10.0链接:https://pan.baidu.com/s/1djNA1WVpmw_x_Y10pjWlSQ提取码:m1fzcuda10.2链接:https://pan.ba原创 2021-10-22 09:37:04 · 4352 阅读 · 0 评论 -
YOLO 中的Anchor机制笔记
众所周知,Yolo v2最大的改进就是锚框机制,并且锚框的生成不是和以前靠经验所得,而是通过更加科学K-Means聚类获得的。那么这个Anchor是如何与yolo相结合的呢? 首先来了解一下锚框机制,锚框(Anchor)就是预设好的一堆虚拟的框,它们的尺寸和大小是固定的,但是它们与物体的真实标注框(GT)存在一些差异。人为设置锚框参数时要尽量使它能够贴近真实框。我们期望锚框是接近于真实框的,但是这显然是不可能的(因为真实框大小不一样,而锚框尺寸是固定不变的)。但是我们可以通过网络预测的结果去调整锚框..原创 2021-08-31 11:50:51 · 9075 阅读 · 4 评论 -
DarkNet53Pytorch实现和.pth的预训练权重下载
DarkNet53是Yolov3的主干网,当我们想拿来做分割或者分类的时候需要将其单独编写出来,并加载预训练的权重。我在网上找了挺久,不知道为什么权重文件都是.weights或者.conv结尾的,这样的文件貌似pytorch无法直接加载,所以本文给大家分享一下它的预训练权重,大家有需要的可以来下载:链接:https://pan.baidu.com/s/1n6PRMSQGtdWzQqkyYTDc5w提取码:3h03关于代码,我是在别人的基础上进行了一些修改,使得最后两个block的步长为1,最后两个bl原创 2021-07-11 14:34:31 · 2281 阅读 · 5 评论 -
目标检测---SSD
中心思想SSD是一阶段目标检测算法,它没有rnp结构,采用在多个卷积层去预测结果(提取结果用的是卷积,不是线性层),所以在小目标上预测的效果更好(小目标由于网络层数变深,仅在最后一层预测效果会很差,如图所示,在8x8的特征图上预测较小的目标猫,在4x4的特征图上预测较大的目标狗)这是原文中的图,图(b)和 图(c)中的虚线框就是生成的 default box(Faster-Rcnn中叫anchors),然后在不同特征层上去生成不同尺寸的dfault boxes,并且每个defalut boxes有着不原创 2021-06-12 14:39:51 · 451 阅读 · 0 评论 -
Faser-RCNN之ROIPooling详解
在Faster-rcnn中,ROIPooling的作用是将原图像上不同大小的proposal映射到特征图上同等大小的区域,以便后面进行分类和回归预测。既然是pooling,它的本质也是一种最大池化。那么究竟是如何映射的呢?可以通过代码来了解一下这个是roi的代码部分,其中输入feature是网络输出的特征图,proposal是RPN网络生成的,并且经过筛选的候选框,image_shapes是原始图像的尺寸。输出就是经过roi之后固定区域的候选框。通过debug来详细看一下各个部分的形状featur原创 2021-06-06 11:59:17 · 2096 阅读 · 1 评论