知识点记录
记录深度学习方面的知识,学习过程之类的
北京纯牛奶
做个知识点记录的工具而已,其他绕道!
展开
-
图片批量jpg和png之间互相转换
之后,将文件夹txt后缀改成 .bat,记得将改完之后的 .bat文件与需要转换的图片在一个目录下。意思是将jpg转换成png,其他的步骤跟上面一样。直接运行 .bat文件即可。下面是png转换成jpg。原创 2022-09-03 11:16:48 · 342 阅读 · 0 评论 -
Mask生成自己的txt文件----train和val两个
当你的标签数据集没有txt文件的时候,记得使用下面的的代码生成两个文件txt文件夹,分别为train.txt和val.txt文件。如果你在data_root/split_dir/下成功找到了train.txt和val.txt文件,就没有问题了。split_dir则是在data_root下生成splittxt文件保存的文件夹目录,其他的就不需要怎么改了。data_root目录是指Mask目录,不是原始的图片文件,是标签文件。data_root写自己的工作目录名称,ann_dir写标签图片所在的目录,...原创 2022-07-31 13:37:25 · 735 阅读 · 0 评论 -
卸载nvidia本身自带的显卡和安装nvidia显卡驱动
安装显卡驱动的过程中报错:界面为:参考博客:https://blog.csdn.net/wohu1104/article/details/107032493之后记得“重启”,如果不重启,好像不行之后,运行,效果为:之后显示之后,好像也会报错,但三记得一直按回车就行!...原创 2022-06-13 17:52:18 · 355 阅读 · 1 评论 -
安装显卡驱动,每次关机都掉显卡驱动
下载官网网址:https://www.nvidia.cn/drivers/results/181582/安装:sudo chmod a+x NVIDIA-Linux-x86_64-455.38.run sudo ./NVIDIA-Linux-x86_64-455.38.run之后一直确定就可以原创 2021-12-03 21:40:22 · 2393 阅读 · 0 评论 -
pip使用镜像安装requirements.txt文件
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --default-timeout=1000 -r requirements.txt原创 2021-11-24 16:31:20 · 2976 阅读 · 0 评论 -
TP、TN、FP和FN
混淆矩阵True Positive(真正,TP):将正类预测为正类数True Negative(真负,TN):将负类预测为负类数False Positive(假正,FP):将负类预测为正类数误报 (Type I error)False Negative(假负,FN):将正类预测为负类数→漏报 (Type II error)...原创 2021-07-01 15:19:48 · 963 阅读 · 0 评论 -
Pytorch设置随机数种子,使训练结果可复现。
在使用PyTorch时,如果希望通过设置随机数种子,在gpu或cpu上固定每一次的训练结果,则需要在程序执行的开始处添加以下代码:def setup_seed(seed): torch.manual_seed(seed) torch.cuda.manual_seed_all(seed) np.random.seed(seed) random.seed(seed) torch.backends.cudnn.deterministic = True# 设转载 2021-06-14 15:20:38 · 728 阅读 · 0 评论 -
代码实用技巧
1、进入Windows PowerShell界面,跟Linux系统差不多。shift+鼠标右键(在桌面可以看到选择项)2、进入tensorboard界面现在根目录下,C:\Users\Admin\Desktop\Papper\GrabageCNN,此目录下一级目录就是可以看到runs目录tensorboard --logdir=runs --host=127.0.0.1另一种报错把Writer相关的加载文件必须进行加载tensorboardX启动命令:tensorboard --logdir原创 2021-06-08 19:52:50 · 200 阅读 · 1 评论 -
DynamicConv(动态卷积)
DynamicConv(动态卷积)第一个总结:动态卷积的目标在于:在网络性能与计算负载中寻求均衡。常规提升网络性能的方法(更宽、更深)往往会导致更高的计算消耗,因此对于高效网络并不友好。因而,相比静态卷积,动态卷积具有更强的特征表达能力。相比静态感知器,动态感知器具有更大的模型。它包含两个额外的计算:(a)注意力权值计算;(2)动态权值融合。尽管如此,这两点额外计算相比感知器的计算量可以忽略:Dynamic Convolution类似于动态感知器,动态卷积同样具有K个核。按照CNN中的经典设原创 2020-08-23 21:21:01 · 8447 阅读 · 0 评论 -
FPN网络详解(知识点记录)
FPN网络详解特征图金字塔网络FPN(Feature Pyramid Networks)是2017年提出的一种网络,FPN主要解决的是物体检测中的多尺度问题,通过简单的网络连接改变,在基本不增加原有模型计算量的情况下,大幅度提升了小物体检测的性能。通常,利用网络对物体进行检测时,浅层网络分辨率高,学到的是图片的细节特征,深层网络,分辨率低,学到的更多的是语义特征。1、通常的CNN使用如下图中显示的网络,使用最后一层特征图进行预测例如VGG16,feat_stride=16,表示若原图大小原创 2020-08-23 21:15:48 · 3753 阅读 · 0 评论 -
马赛克数据增强作用
马赛克数据增强确实能有效解决模型训练中最头疼的“小对象问题”,即小对象不如大对象那样准确地被检测到。原创 2020-08-23 21:04:43 · 3123 阅读 · 1 评论 -
目标检测网络的组成
组成目标检测网络的两个重要部分:Backbone和Detection head。一、Backbone和Detection head通常,为了实现从图像中检测目标的位置和类别,我们会先从图像中提取出些必要的特征信息,比如HOG特征,然后利用这些特征去实现定位和分类。而在在深度学习这一块,backbone部分的网络就是负责从图像中提取特征,当然,这里提出的是什么样的特征,我们是无从得知的,毕竟深度学习的“黑盒子”特性至今还无法真正将其面纱揭开。那么,如何去设计一个backbone去提取图像中的特原创 2020-08-23 21:03:37 · 1362 阅读 · 0 评论 -
单阶段和双阶段网络模型区别及记录
双阶段:一个阶段提出备选框,一个阶段对备选框进行判断。是一个两阶段级联的网络。备选框的生成和备选框的判断是两个过程。以RCNN系列为主流和代表。主要为RCNN系列的网络。RCNN SPPNet(Spatial Pyramid Pooling) Fast RCNN Faster RCNN RFCN(Region based FullyConvNet) Mask RCNN Light Head RCNN单阶段:单阶段的网络,整个生成备选框的过程一体化的实现。代表有YOLO系列和...原创 2020-08-23 21:00:59 · 5694 阅读 · 3 评论 -
coco数据集记录
1 简介微软发布的 COCO 数据库是一个大型图像数据集, 专为对象检测、分割、人体关键点检测、语义分割和字幕生成而设计。COCO 数据库的网址是:MS COCO 数据集主页:http://mscoco.org/ Github 网址:https://github.com/Xinering/cocoapi 关于 API 更多的细节在网站:http://mscoco.org/dataset/#downloadCOCO API提供了Matlab, Python和Lua的API接口。该API ..原创 2020-08-23 20:59:03 · 748 阅读 · 0 评论 -
分割评价指标
IOU标准介绍1 目标检测和图像分割的评价标准是一样的,核心都是使用IOU标准;2 目标检测和图像分割使用的IOU方法都是一样的,不同的是目标检测面向判断选定框和预测框;而图像分割面向的是选定掩码和预测掩码;3 在目标检测中,检测目标用box进行评价。我们的IOU评价方式为(将预测框和选定框放入公式中去判定);而在图像分割中,我们用掩码来进行评价,IOU评价方式为(将预测掩码和选定掩码放入公式汇中去判定):1、IoU相当于两个区域重叠的部分除以两个区域的集合部分得出的结果,IO.原创 2020-08-23 20:51:37 · 2083 阅读 · 0 评论 -
BlendMask知识点记录
BlendMask知识点记录论文名称:《BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation》论文链接:https://arxiv.org/abs/2001.00309新出的实例分割算法,融合了mask rcnn和yolact的算法思想,既有mask rcnn的ROI,又有yolact的proto type(base)。该模型效果达到state-of-the-art,精度最高能到41.3AP,实时版本BlendMask-RT性原创 2020-08-19 22:28:12 · 5836 阅读 · 0 评论 -
backbone、head、neck功能
backbone:翻译的很好,主干部分。这个主干网络大多时候指的是提取特征的网络,其作用就是提取图片中的信息,共后面的网络使用。这些网络经常使用的是resnet VGG等,而不是我们自己设计的网络,因为这些网络已经证明了在分类等问题上的特征提取能力是很强的。在用这些网络作为backbone的时候,都是直接加载官方已经训练好的模型参数,后面接着我们自己的网络。让网络的这两个部分同时进行训练,因为加载的backbone模型已经具有提取特征的能力了,在我们的训练过程中,会对他进行微调,使得其更适合于我们自己...原创 2020-08-19 22:18:59 · 1689 阅读 · 0 评论 -
detectron2(目标检测框架):配置config解析
以下链接是个人关于detectron2(目标检测框架),所有见解,如有错误欢迎大家指出,我会第一时间纠正。前言通过前面的博客,我们知道怎么去训练coco数据,但是我们的目的,肯定是去训练自己的数据,在这之前,需要为大家讲解一些相关的配置config信息,相信大家把网络跑起来的时候,也就是执行如下指令:python tools/train_net.py \--num-gpus 2 \--config-file configs/COCO-Detection/retinanet_R_50_FPN_3x.转载 2020-08-06 16:29:58 · 3506 阅读 · 6 评论 -
anchor box原理理解
对anchor box的一些个人理解滑动窗口这是比较原始的目标检测方法,给定一个固定尺寸的窗口,根据设定的步伐,一步一步的从左至右、从上至下滑动,把每个窗口输入到卷积神经网络中进行预测和分类,这样做有两个缺点:1、由于窗口尺寸固定,因此不适合形变较大的物体2、窗口较多,运算量大为什么提出anchor box?主要有两个原因:1、一个窗口只能检测一个目标,我理解的是,有多个anchor box就可以在图片上检测多个目标,图片上有多个anchor box,每个anchor box检测一个原创 2020-08-02 23:37:59 · 841 阅读 · 0 评论 -
Tips——SOTA啥意思?
SOTA也就是state-of-the-art,若某篇论文能够称为SOTA,就表明其提出的算法(模型)的性能在当前是最优的。转载 2020-07-30 21:48:44 · 1284 阅读 · 0 评论 -
深度学习中什么是消融实验?
什么是消融实验(Ablation experiment)?消融实验(Ablation experiment)这个概念是在论文《Faster R-CNN》中提出来的,但是这是我在计算机视觉当中看到的,应该不是这个文章提出来的。:消融实验类相当于:“控制变量法”。...原创 2020-07-30 16:33:36 · 9721 阅读 · 2 评论 -
Conditional Convolutions for Instance Segmentation知识点总结
Conditional Convolutions for Instance Segmentation第1次记录介绍一篇ECCV 2020被评为Oral的论文,它也是目前单阶段实例分割方面的又一佳作,它就是由沈春华大佬团队出品的--CondInst,通过引入条件卷积到实例分割中去,实现了精度上比Mask R-CNN高一丢丢(约0.5个点),加上seg loss后可以涨一个点,从而超过Mask R-CNN;速度和Mask R-CNN差不多,稍好一点;本文提出了一个简单而有效的实例分割框架,称为Con原创 2020-07-27 17:27:26 · 2738 阅读 · 0 评论 -
什么是掩膜(mask)
mask是用于部分或完全隐藏对象或元素的部分的图形操作。 将mask应用于图形对象的效果就好像将图形对象通过遮罩涂在背景上,从而完全或部分地遮盖了图形对象的各个部分,而遮罩内的图像不变化。在图像处理中常用来提取ROI区域,具体可以看下图。从上图中使用两个圆形运算做mask:(1)第二个图是取两个圆的异或(2)第三个图取两个圆的并集(3)第四个图取两个圆的交集最后和原图进行掩膜操作,形象的说就是将mask放在原图上然后在上面刷黑漆,mask区域图像不变,其他区域被涂黑了。...转载 2020-07-27 16:28:21 · 2713 阅读 · 0 评论 -
ubuntu使用GPU跑项目
ubuntu使用GPU跑项目,需要安装显卡驱动、cuda驱动和cudnn驱动,但是真正需要下载安装包的只是cuda驱动,显卡驱动和cudnn驱动都是直接在命令窗口上下载的。不过我只下载的cuda驱动,好像是,显卡驱动好像也下载了,之后看到哪个博客最后是自己直接安装的,没有下载驱动包,忘记了。之后发现好像显卡驱动也要下载,但是下载的方式不同,很头疼,可能安装的方式不同吧。...原创 2020-07-20 12:03:45 · 1040 阅读 · 0 评论 -
Snake算法知识点记录
Snake算法snake是一种主动轮廓模型,主动轮廓模型目前用到了2种:CV和snake。snake在逐步迭代优化过程的目标是能量函数最小化,snake的目标不像sobel、canny等找到整张图的轮廓。它只搜索你给出的初始轮廓附近,达到轮廓更精确的目标,至少原版的snake只能达到局部优化的目标。因为曲线曲率的关系,闭合的轮廓曲线中,凸曲线按照法向量的方向,具有向内的作用力;凹曲线法向量向外,具有向外的力。而曲率计算就是跟一阶导数、二阶导数相关的。在迭代过程中,弹性能量能快速的把轮廓压缩成原创 2020-07-16 22:43:21 · 1979 阅读 · 0 评论 -
pip install -r requirements.txt啥意思?
安装文件下的requirements.txt中的所有包,其中包的格式如下:原创 2020-07-14 21:49:17 · 7989 阅读 · 3 评论 -
GitHub的.gitignore文件设置
用Eclipse连接GitHub在本地仓库(最上层文件夹)建立.gitignore文件后,所有子文件夹下对应文件或者文件夹在submit的时候就会被忽略。我将Eclipse的workspace当作仓库,所以有.metadata,RemoteSystemsTempFiles和Servers文件夹,这个应该被忽略。在该仓库中其他的所有projects,都会被提交到github上的同一个仓库。文件内容如下:/.metadata//RemoteSystemsTempFiles//Servers/bi转载 2020-07-13 15:52:06 · 169 阅读 · 0 评论 -
GitHub下载时报错500: Internal Server Error
这个错误一般是github出现了问题,本人解决办法是1、百度:码云。新建一个账号2、新建仓库3、导入已有仓库4、将GitHub的地址放进来,不是网址,比如我下面指示的那种5、点击导入,即可在码云上面下载...原创 2020-07-13 14:56:29 · 1538 阅读 · 0 评论 -
关于os.listdir()、os.path.isdir()、os.path.join()的用法和区别
在自建数据集的时候需要常需要通过遍历文件夹,检阅所得是否为所需。这时候os.listdir()、os.path.isdir()、os.path.join()三大法宝就可以上场了。root:F:\pytorch\迁移学习\pokemon1.os.listdir():返回输入路径下的文件和列表名称经过os.listdir()操作之后,pokemon文件夹下的所有文件全部被读取作为list的元素,但是如果是文件夹,那么只读取文件夹的名字,但如果是文件则会读取文件的名字并带属性后缀(.py/.cs转载 2020-07-08 10:57:29 · 1017 阅读 · 0 评论 -
python add_argument()用法解析
这篇文章主要介绍了python add_argument()用法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下介绍:argparseargparse 是 Python 内置的一个用于命令项选项与参数解析的模块,通过在程序中定义好我们需要的参数,argparse 将会从 sys.argv 中解析出这些参数,并自动生成帮助和使用信息。当然,Python 也有第三方的库可用于命令行解析,而且功能也更加强大,比如 docopt,Click。argpar转载 2020-07-08 10:28:19 · 1806 阅读 · 0 评论 -
那些酷炫的深度学习网络图怎么画出来的?
1 NN-SVG这个工具可以非常方便的画出各种类型的图,是下面这位小哥哥开发的,来自于麻省理工学院弗兰克尔生物工程实验室, 该实验室开发可视化和机器学习工具用于分析生物数据。github地址:https://github.com/zfrenchee画图工具体验地址:http://alexlenail.me/NN-SVG/可以绘制的图包括以节点形式展示的FCNN style,这个特别适合传统的全连接神经网络的绘制。以平铺网络结构展示的LeNet style,用二维的方式,适合查看每转载 2020-07-02 21:56:22 · 286 阅读 · 0 评论 -
CIFAR-10数据集下载方式
这个是我网上搜到的CIFAR-10数据集,里面是图片的内容,但是需要比较好的网速网址wei :https://figshare.com/articles/CIFAR10-DVS_New/4724671/2参考上面的信息下载试试原创 2020-07-01 16:35:21 · 1001 阅读 · 0 评论 -
安装from torchscope import scope
其实就是安装scope首先安装torchscopepip install torchscope 安装成功之后再安装scope,但是这个安装我一直都有点问题,因此找了一个可以运行的安装方法pip install --upgrade git+https://github.com/Tramac/torchscope.git如果安装不了这个:pip install --upgrade git+https://github.com/Tramac/torchscope.git是因为没有安装g...原创 2020-07-01 11:41:36 · 829 阅读 · 0 评论 -
通俗理解“回调函数”
我们先来看看回调的英文定义:A callback is a function that is passed as an argument to another function and is executed after its parent function has completed。字面上的理解,回调函数就是一个参数,将这个函数作为参数传到另一个函数里面,当那个函数执行完之后,再执行传进去的这个函数。这个过程就叫做回调。其实也很好理解对吧,回调,回调,就是回头调用的意思。主函数的事先干完,回头再转载 2020-06-27 20:52:16 · 336 阅读 · 0 评论 -
去池化操作(unpooling)操作
去池化(unpooling)操作如下:原创 2020-06-07 17:13:30 · 1195 阅读 · 0 评论 -
深度学习大致内容
深度学习的分布情况,大致的分布可以按照下面的分布大致的确定自己的方向原创 2020-06-07 15:36:08 · 153 阅读 · 1 评论 -
图卷积神经网络GCN---池化层代表作
GNN Pooling文章目录GNN Pooling 1 Deep Convolutional Networks on Graph-Structured Data 2 Convolutional neural networks on graphs with fast localized spectral filtering 3 An End-to-End Deep Learning Architecture for Graph Classification 4 Hierarchical转载 2020-05-15 14:15:28 · 1478 阅读 · 0 评论 -
各种数据集链接
CVonline:图像数据库(Google直译的结果,希望对大家有帮助)按主题索引行动数据库 属性识别 自主驾驶 生物/医药 相机校准 脸和眼/虹膜数据库 指纹 一般图像 一般RGBD和深度数据集 一般视频 手,掌握,手动和手势数据库 图像,视频和形状数据库检索 对象数据库 人(静),人体姿势 人员检测和跟踪数据库(另见监控) 遥感 场景或地点分割或分...转载 2020-04-24 10:07:46 · 4009 阅读 · 0 评论