自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(144)
  • 资源 (2)
  • 收藏
  • 关注

原创 ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders

具体来说,就是对图像的每个块进行标准化处理,使得每个块的像素值在一定范围内具有相似的统计特性,比如使得每个块的像素均值接近零,标准差接近1。在深度学习领域,尤其是计算机视觉任务中,遮蔽图像建模(Masked Image Modeling, MIM)是一种自监督学习策略,其基本思想是遮蔽(或隐藏)图像中的部分信息,然后训练模型去预测这些遮蔽的部分。总之,遮蔽图像的2D稀疏数组表示为稀疏卷积的使用提供了理论基础,这种卷积操作更符合遮蔽图像的特性,并且可以提高模型在自监督学习任务中的性能。

2023-12-09 08:28:21 507

原创 pycharm中debug,py文件

3、在小三角旁边右键调用调试。5.选择单步执行,走的更慢。1、先把需要的实参传入。2、在合适位置打上断点。

2023-12-07 11:02:08 689

原创 pycharm中py文件设置参数

直接对应复制进去即可。

2023-12-07 10:25:32 887

原创 win10-mmgen安装/cyclegan运行问题记录

mmconda环境:conda:conda install pytorch1.11.0 torchvision0.12.0 torchaudio==0.11.0 cudatoolkit=11.3 -c pytorch参考https://blog.csdn.net/qq_40280673?type=bloghttps://blog.csdn.net/qq_41612527/article/details/109162194采用YOLOV8环境成功运行遇visdom报错解决:在控制台下启用visdo

2023-11-02 16:09:12 189

原创 (1)VisDrone无人机目标检测数据集介绍

官网:http://aiskyeye.com/VisDrone数据集,包含了10个类(即行人、人、汽车、面包车、公共汽车、卡车、汽车、自行车、遮阳三轮车和三轮车)无人机计算机视觉相关检测和跟踪( Vision Meets Drones)作为近年来的研究热点之一,受到了广泛关注,这两年在各大会议上都有相关文章发表,并且也有一些竞赛。

2022-12-28 16:42:11 8817

原创 RTFormer代码理解结合论文

原论文代码地址:https://github.com/PaddlePaddle/PaddleSeg/blob/develop/paddleseg/models/rtformer.py。原论文地址:https://arxiv.org/abs/2210.07124。

2022-11-17 15:32:02 484

原创 YOLOX&NEU-DET钢材表面缺陷任务划分数据集

tips: 这里是voc2yolo哈不是xml2yolo!所以运行代码前检查一下自己的数据标注的格式,一定要是pascalvoc格式的xml哦,标签有difficult等的。

2022-10-10 09:40:39 1060

原创 linux中make命令报错,Linux命令make报错总结

yacc是一个文法分析器的生成器,bison即是yacc的GNU版本.Lex和YACC是用于构造词法分析机和语法解释器的工具,利用Lex和YACC你可以轻松的构造一个语法解释器。编译一个linux下的c系统,包含词法和语法分析模块,Linux上用bison和flex。make主要检查的是时间戳,只要target比依赖的文件时间靠后它就认为不需要编译。解决方法:下载flex apt-get install flex。或者在http://flex.sourceforge.net/ 上下载。

2022-09-22 12:25:04 4295

原创 linux怎么修改只读权限

u 表示该文件的拥有者,g 表示与该文件的拥有者属于同一个群体(group)者,o 表示其他以外的人,a 表示这三者皆是。r 表示可读取,w 表示可写入,x 表示可执行,X 表示只有当该文件是个子目录或者该文件已经被设定过为可执行。

2022-09-22 12:05:37 2754

原创 python之parser.add_argument()用法——命令行选项、参数和子命令解析器

1、创建一个解析器——创建 ArgumentParser() 对象。2、添加参数——调用 add_argument() 方法添加参数。3、解析参数——使用 parse_args() 解析添加的参数。四、python args parse_args() 报错解决。add_argument() 方法定义如何解析命令行参数。原文:http://t.csdn.cn/G0Ixu。二、argparse使用——代码示例。五、其他问题汇总(评论小伙伴问的)描述description。1、下划线_和横线-的区别。

2022-09-21 21:49:57 587

原创 1-Adversarial Learning for Semi-Supervised Semantic Segmentation

我们提出了一个半监督语义分割的方法,使用了对抗网络。设计了一个鉴别器,去区分预测概率图与真实分割分布,同时考虑了空间分辨率。我们表明,通过**将对抗性损失与所提出模型的标准交叉熵损失耦合起来**,所提出的鉴别器可以用于提高语义分割精度。**此外,鉴别器通过发现未标记图像的预测结果中的可信区域来实现半监督学习,从而提供额外的监督信号。**与使用弱标记图像的现有方法相比,我们的方法利用未标记图像来增强分割模型。在PASCAL VOC 2012和Cityscapes数据集上的实验结果证明了该算法的有效性。

2022-09-19 22:54:13 1433

原创 机器学习数据预处理1:独热编码(One-Hot)及其代码

文章:http://t.csdn.cn/ndFcq。

2022-09-16 10:54:23 279

原创 语义分割概念及应用介绍

语义分割是一种典型的计算机视觉问题,其涉及将一些原始数据(例如,平面图像)作为输入并将它们转换为具有突出显示的感兴趣区域的掩模。许多人使用术语全像素语义分割(full-pixel semantic segmentation),其中图像中的每个像素根据其所属的感兴趣对象被分配类别ID。全像素语义分割根据其所属的感兴趣对象分配图像中的每个像素具有的类别ID。语义分割: 识别图像中存在的内容以及位置(通过查找属于它的所有像素)。注意,与其他基于图像的任务相比,语义分割是完全不同的且先进的,例如,

2022-09-16 10:10:38 872

原创 Windows下使用Git克隆项目

4、克隆项目(这里克隆的是 vue-element-admin 框架应用)1、没有安装git的,从 git官网 下载windows版本的git。2、一般使用默认设置即可:一路next下去,git安装完毕!

2022-09-16 09:23:41 1156

原创 捋一捋pytorch官方的FasterRCNN代码

原文:https://zhuanlan.zhihu.com/p/145842317参考:http://t.csdn.cn/idjzU。

2022-08-29 13:45:13 653

原创 class MultiScaleRoIAlign(nn.Module):

知识补充:【1.1.2 FPN结构详解】 https://www.bilibili.com/video/BV1dh411U7D9?首先计算每个 feature_map 相对于网络输入 image 的下采样倍率 scale。levelmap函数用于FPN生成的propoals/RoI映射回P2-P5,即映射回feature map。...

2022-08-29 13:42:40 706

原创 Python __call__()方法(详解版

原文:http://c.biancheng.net/view/2380.html本节再介绍 Python 类中一个非常特殊的实例方法,即()。该方法的功能类似于在类中重载 () 运算符,使得类实例对象可以像调用普通函数那样,以“对象名()”的形式使用。可以看到,通过在 CLanguage 类中实现() 方法,使的 clangs 实例对象变为了可调用对象。对于可调用对象,实际上“名称()”可以理解为是“名称.()”的简写。运行程序会发现,其运行结果和之前完全相同。...

2022-08-29 12:35:36 284

原创 python中的类型提示(定义函数时加入箭头->)

就算你静态限定了int,输入为float的时候也不会报错,输出也不会变成期待的int类型。其实就是变量类型的动态定义和静态定义的区别。同样一个函数可以不加->表示动态定义和加->表示静态定义。对于上面左边函数,对n的数据类型不一定为int,也可以为float等等。官方网站:https://www.python.org/dev/peps/pep-0484/偶尔看到一些代码在定义函数时,在def那一行后面会加一个->。这个玩意儿有个专门的名词叫 type hint, 即类型提示。上面代码期待的类型为int。..

2022-08-26 21:18:07 866

原创 rpn:def concat_box_prediction_layers

代码】rpn:def concat_box_prediction_layers。

2022-08-08 14:25:56 131

原创 class AnchorGenerator:def generate_anchors测试

首先对于初始化来讲self.cell_anchors,遍历zip(sizes, aspect_ratios),传入generate_anchors中,对于generate_anchors来讲,其得到的参数实际为size=(128, 256, 512),aspect_ratio=(0.5, 1.0, 2.0)。第一次传入(32,)和(0.5, 1.0, 2.0),)生成前三个。遍历一圈,生成15个。此时对每一个位置来讲共生成。......

2022-08-05 15:51:06 130

原创 def fasterrcnn_resnet50_fpn()实例测试

推测没有预测框的原因是数据是随机生成的。

2022-07-28 22:46:34 407

原创 python子类继承父类构造函数

二子类不需要自动调用父类的方法子类重写__init__()方法,实例化子类后,将不会自动调用父类的__init__()的方法。一子类调用父类的方法子类不重写__init__()方法,实例化子类后,会自动调用父类的__init__()的方法。三子类重写__init__()方法又需要调用父类的方法使用super关键词。...

2022-07-28 19:46:36 1845 1

原创 FasterRCNN示例代码测试1:令anchor_generator = None

32,),(64,),(128,),(256,),(512,)分别代表五个feature_map上取值大小;一般情况可用自己设置的anchor_generator,也可以系统默认的,参考fast-rcnn源码。推测默认的def_default_anchorgen(),这个是FPN的,多尺度生成。还没看锚框生成,暂定。但是我使用默认的,就发生了报错。...

2022-07-22 11:11:27 164

原创 类的属性新建(初级理解)

代码】类的属性新建(初级理解)

2022-07-22 09:42:55 120

原创 GeneralizedRCNN:features = OrderedDict([(“0“, features)])

代码】features=self.backbone(images.tensors)

2022-07-21 10:08:31 161

原创 Check for degenerate boxes检查退化框

判断boxes的二维后两个数是否小于二维前两个数,若存在,返回true(这里跟所解决的代码问题不一样,所要解决应该是返回box,不是true?enumerate()函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在for循环当中。any()函数用于判断给定的可迭代参数iterable是否全部为False,则返回False,如果有一个为True,则返回True。它是位置对应验证的,比如第三个跟第一个比,第四个跟第二个比。...

2022-07-21 09:16:05 114

原创 img.shape[-2:]/len(img.shape[-2:]):GeneralizedRCNN:original_image_sizes中的 torch._assert

shape[-2]即倒数第二维度至最后一维度,即最后两维度(-2维度,-1维度),img.shape[-2]即求出来最后两维度的样本数量,在image的tensor形式中,图片以(C,H,W)存储,故后两维度应该为(H,W),即img.shape[-2]得到(H,W)貌似没特别大的作用。len对shape来说是得到维度的数目,即一维得1,二维得2,len(img.shape)得3,len(img.shape[-2])即得2..shape[1]求1维的样本数量,不准确理解即列数;...

2022-07-20 20:58:23 1522 2

原创 Python高级语法-装饰器(Python语法糖@)

参考https。

2022-07-20 11:31:23 198

原创 Python中的*args和**kwargs

参考https在Python中的代码中经常会见到这两个词args和kwargs,前面通常还会加上一个或者两个星号。其实这只是编程人员约定的变量名字,args是arguments的缩写,表示位置参数;kwargs是keywordarguments的缩写,表示关键字参数。这其实就是Python中可变参数的两种形式,并且*args必须放在**kwargs的前面,因为位置参数在关键字参数的前面。补知识点位置参数(positional)......

2022-07-20 11:30:34 85

原创 Pycharm退出pytest模式(run pytest in模式)

第二步可以看到左侧Python下有两个文件夹,如果进入了test模式,就会有‘Pythontest’一栏,打开pycharm进入了test模式,具体表现为用“Run‘py.testxxx.py’”第三步选定Pythontest,这时点击上面的‘-’号去掉这栏下的文件即可。第一步点击顶部运行键——选择‘Editconfiguration’,如果上述方法,只是临时解决,过段时间又是pytest了。然后确定,再次右键代码,就可以执行run模式了。......

2022-07-20 11:03:12 4189

原创 ython中if __name__ == ‘__main__‘:的作用和原理

参考http。

2022-07-20 10:41:02 63

原创 装饰器解决TypeError: ‘NoneType‘ object is not callable

网上有人说去掉被装饰函数(原函数)后面的‘()’,虽然也可以让程序不报错,我却觉得这违背了装饰器的意义装饰器在不改变被装饰函数的源代码和调用方式的情况下增加新的功能,如果去掉原函数的括号那不就是改变调用方式了吗,所以不可取。参考https//blog.csdn.net/qq_41320433/article/details/104347119。callable(可调用)对象是指一个后面可以加‘()’的对象。既然报错是‘不可调用’,那就去掉调用函数的‘()’即可。......

2022-07-18 22:31:53 416

原创 随机梯度下降法(SGD)原理解析及其改进优化算法

原文章:https://zhuanlan.zhihu.com/p/152566066

2022-07-05 11:16:16 677

原创 AlexNet网络结构详解及代码实现

注:右侧一处错误,更正(31-5)/1+1=27

2022-07-02 17:22:20 513

原创 非饱和激活函数ReLu为什么比饱和激活函数sigmoid、tanh好

sigmoid和tanh是“饱和激活函数”,而ReLU及其变体则是“非饱和激活函数”。使用“非饱和激活函数”的优势在于两点:(1)“非饱和激活函数”能解决所谓的“梯度消失”问题。(2)能加快收敛速度。sigmoid将实值输出压缩在[0,1]范围内;tanh函数将实值输出压缩在[-1, 1]的范围。sigmoid函数在历史上曾非常常用,输出值范围为[0, 1]之间的实数。但是现在它已经不太受欢迎了,实际中很少使用。原因如下:(1)sigmoid函数饱和使梯度消失(sigmoidsaturate and kil

2022-07-02 10:31:10 2271

原创 神经网络图像输入零均值化的作用(AlexNet)

原文:https://blog.csdn.net/wtrnash/article/details/87893725最近有和同学探讨到为什么CNN在做图像识别相关任务时,对图像需要进行零均值化,CS231N里面有进行讲述,但讲得其实不是很清楚,比较难理解,所以在这里做一下较为详细的说明。首先介绍一下归一化(Normalization)、标准化(Standardization)以及零均值化(zero-mean)分别的公式和概念。归一化的公式为...

2022-07-02 10:02:24 647

原创 图像分类的top-1 and top-5 error

Top-1 Error:假设模型预测某个对象的类别,模型输出1个预测结果,那么这一个结果能判断正确的概率就是Top-1正确率。判断错误的概率就是Top-1错误率。简言之就是模型判错的概率。Top-5 Error :假设模型预测某个对象的类别,模型输出5个预测结果,只要其中一个能判断正确类别,这个概率就是Top-5正确率,反之,预测输出的五个结果都错误的概率就是Top-5错误率。一般来说,Top-1 Error和Top-5 Error越低,模型的性能也就越好。且Top-5 Error 往往小于Top-1

2022-06-29 16:50:27 1008

原创 p19.matplotlib:Animation 动画

使用matplotlib做动画也是可以的,我们使用其中一种方式,function animation来说说, 具体可参考matplotlib animation api。首先,我们做一些准备工作:我们的数据是一个0~2π内的正弦曲线:接着,构造自定义动画函数animate,用来更新每一帧上各个x对应的y坐标值,参数表示第i帧:然后,构造开始帧函数init:参数设置接下来,我们调用FuncAnimation函数生成动画。参数说明:fig 进行动画绘制的figurefunc 自定义动画函数,即传入

2022-06-25 06:42:29 452

原创 p18.Matplotlib:次坐标轴

有时候我们会用到次坐标轴,即在同个图上有第2个y轴存在。同样可以用matplotlib做到,而且很简单。首先,我们做一些准备工作:可以看到,y2和y1是互相倒置的。接着,获取figure默认的坐标系 ax1:第二个y坐标对ax1调用twinx()方法,生成如同镜面效果后的ax2:接着进行绘图, 将 y1, y2 分别画在 ax1, ax2 上:显示图像:...

2022-06-25 06:39:08 743

原创 p17.matplotlib:图中图

这次我们来讲matplotlib里一个很有意思的功能,叫做图中图(plot in plot),最后的效果如下:可以看到,整个Figure 1包含了三个图,其中两个小图title inside 1和title inside 2又出现在大图title中。这是如何做到的呢?首先是一些准备工作:大图接着,我们来绘制大图。首先确定大图左下角的位置以及宽高:注意,4个值都是占整个figure坐标系的百分比。在这里,假设figure的大小是10x10,那么大图就被包含在由(1, 1)开始,宽8,高8的坐标系内。

2022-06-25 06:35:15 732

电赛8组《设计报告》.docx

最终版本找不到了,这个也差不多

2021-03-25

arduino二维云台代码带注释

arduino二维云台代码带注释,代码简单,注释还行,适合新手,例: void loop() { while(Serial.available() > 0) //当Serial.available()>0时,说明串口接收到了数据,可以读取。 { char flag=Serial.read(); delay(2); if(flag=='u') //当串口输入‘u’时,上舵机向上转动5° a=a+5; if(flag=='d') //当串口输入‘d’时,上舵机向下转动5° a=a-5;

2020-10-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除