![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 50
weixin_44940947
这个作者很懒,什么都没留下…
展开
-
安装yolov5库
pipinstallyolov5-ihttps//pypi.douban.com/simple/只需5分钟!下面是本人在安装时踩得坑单纯的以为pipinstallyolov5,速度极慢。目标检测,有网友已经将其做成了库,提交到了官方的索引库。conda一定要尽可能使用镜像源!......原创 2022-07-22 21:06:07 · 639 阅读 · 1 评论 -
VisDrone数据集转COCO格式(json)踩坑记录
注意VisDrone类别中【i.e.,ignoredregions(0),pedestrian(1),people(2),bicycle(3),car(4),van(5),truck(6),tricycle(7),awning-tricycle(8),bus(9),motor(10),others(11)】ignoredregions(0)、others(11)的score=0,代码中可通过score=0过滤掉(再具体详见上述链接)原因发现bboxheight为0;...原创 2022-07-20 17:22:38 · 1624 阅读 · 0 评论 -
Apex使用
借师兄一臂之力,把apex装上后,也看了实现的主要源码,咱就按官方命令跑起来呗,不跑不知道,一跑吓一跳,就报上图的错:没DIR?好吧,又去看源码果断去建个data,注意:imagenet格式是图片在单个对应类别的文件夹里,建不好还是无DIR最后,你得把数据集传进来呐,苦逼的我将data置于何地。。。...原创 2022-04-13 22:43:31 · 199 阅读 · 0 评论 -
Swin transformer里的mask操作
实现批量操作问题:经shifted windows,特征图被划分成大小不一的小窗口,显然这样就无法进行批量操作,Swin trans提出使用循环移位方式cyclic shift ,又分成了4个小窗口。相关性不大的窗口做自注意力问题:如果直接循环移位后的各窗口进行自注意力操作,对于像上图C是天上的,与地上的(g)进行自注意力操作的话,两者本来就没大关系,没必要做自注意力。此时引入掩码操作:可以看到,将循环移位后的特征图还是分成4个window,(紫色方块表示移位过来的部分)(可以看到...原创 2022-03-29 10:21:15 · 390 阅读 · 0 评论 -
faster_rcnn学习
RPN具体详解:右边是RPN的结构,使用滑动窗口在特征图上滑动,每滑动到一个位置上,会生成1个一维的向量,(256_d 是 backbone的输出通道数(此处所用网络ZF,若用VGG16,就变成512-d)),在此向量上,分别通过两个全连接层,目标概率(cls layer)和边界框回归参数。2k是针对k个anchor box,是针对每个anchor生成的2个概率,一个是背景的概率,一个是前景的概率,针对每个anchor都会生成4个边界框回归参数。anchor是怎样生成的嫩?...原创 2022-03-17 22:40:55 · 146 阅读 · 0 评论