深度学习
文章平均质量分 68
是七叔呀
Java、python、C
展开
-
解决使用latex报错Can be used only in preamble.
使用latex报错Can be used only in preamble.原创 2022-10-29 20:30:32 · 14443 阅读 · 1 评论 -
使用Latex报错Missing $ inserted.inserted text
使用Latex报错Missing $ inserted.inserted text原创 2022-10-26 21:48:17 · 3931 阅读 · 0 评论 -
python判断两个列表、两个矩阵相等,返回布尔值
python判断两个列表、两个矩阵相等,返回布尔值转载 2022-10-06 19:36:05 · 1152 阅读 · 0 评论 -
空洞卷积原理详解及其pytorch代码实现
空洞卷积及其pytorch实现转载 2022-10-05 22:10:10 · 14137 阅读 · 2 评论 -
配置VScode+Latex 出现Recipe terminated with fatal error: spawn xelatex ENOENT报错
配置VScode+Latex 出现Recipe terminated with fatal error: spawn xelatex ENOENT报错原创 2022-09-23 21:25:27 · 2622 阅读 · 0 评论 -
YOLOv5训练数据提示No labels found、with_suffix使用、yolov5训练时出现WARNING: Ignoring corrupted image and/or label
YOLOv5训练数据提示No labels found、with_suffix(suffix) 替换扩展名,返回新的路径,扩展名存在则不变、yolov5训练时出现WARNING: Ignoring corrupted image and/or label原创 2022-08-03 11:45:00 · 8080 阅读 · 4 评论 -
python报错xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 3, column 50
python报错xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 3, column 50原创 2022-08-02 09:15:00 · 1599 阅读 · 0 评论 -
RAW图像详解及使用Python读取raw格式图像并显示
RAW图像详解及使用Python读取raw格式图像并显示原创 2022-08-01 14:45:00 · 10738 阅读 · 5 评论 -
SDK和API、python ET模块解析xml文件、python路径字符串斜杠替换
SDK和API、python ET模块解析xml文件、python路径字符串斜杠替换原创 2022-07-31 20:45:01 · 689 阅读 · 0 评论 -
YOLO等目标检测模型的非极大值抑制NMS和评价指标(Acc, Precision, Recall, AP, mAP, RoI)、YOLOv5中[email protected]与[email protected]:0.95的含义
YOLO等目标检测模型的非极大值抑制NMS和评价指标(Acc, Precision, Recall, AP, mAP, RoI)、YOLOv5中[email protected]与[email protected]:0.95的含义转载 2022-08-01 09:30:00 · 24080 阅读 · 9 评论 -
python经典字体警告:RuntimeWarning: Glyph 33337 missing from current font. font.set_text(s, 0, flags=flag
python经典字体警告:RuntimeWarning: Glyph missing from current font. font.set_text(s, 0.0, flags=flags)原创 2022-07-31 14:15:45 · 1016 阅读 · 0 评论 -
Python、PyCharm调试的时候写入不了文件分析及解决办法,python处理txt文件的常用操作读、写和追加操作r、r+、w、w+、a、a+
PyCharm调试的时候写入不进文件解决办法、Python常用操作txt的读、写和追加模式原创 2022-07-30 14:17:41 · 3318 阅读 · 1 评论 -
Python离线断网情况下安装numpy、cv2和matplotlib等常用第三方包
联网情况下在命令终端CMD中输入“pipinstallnumpy”即可自动安装,pandas和matplotlib同理一样方法进行自动安装。工作的电脑不能联网,所以不能通过直接输入pip命令来安装。环境电脑上已经安装了Python(没有安装的请参考其他教程)。.........原创 2022-07-18 21:30:09 · 7971 阅读 · 1 评论 -
深度学习中的随机种子torch.manual_seed(number)、torch.cuda.manual_seed(number)
训练模型过程中,会遇到很多的随机性设置,设置随机性并多次实验的结果更加有说服力。但是现在发论文越来越要求模型的可复现性,这时候不得不控制代码的随机性问题且每次随机的初始权重一样,有利于实验的比较和改进简单的说,计算机中生成随机数的过程并不随机百,但是其初始数(种子)是随机的。在深度学习中,(比如深度神经网络)我们常常需要对网络中超参数设定初始值,比如权重,在这里我们需要用到一些生成随机数的函数,这些函数一般通过手动设定种子,最优随机种子不应该去找,随机性的存在正好用来评估模型的鲁棒性。一个优秀的模型,不会原创 2022-06-20 10:52:50 · 6942 阅读 · 0 评论 -
FCN全卷积网络理解及代码实现(来自pytorch官方实现)
FCN是首个端对端的针对像素级预测的全卷积网络而换为卷积层之后,最后得到的是1000通道的2D图像,可以可视化为heat map图。一般说的vgg16是D:全连接操作前后:77512(通道)【假设忽略偏置】\color{red}{【假设忽略偏置】}【假设忽略偏置】全连接FC1计算:计算对应某一个结点的输出,将该节点与上一层某一个结点的权重与输入对应节点数值相乘,再求和下层使用7*7的卷积核、stride=1,4096个卷积核的一个卷积层一个卷积核和FC1一个节点参数量一样\color{red}{一原创 2022-06-14 22:42:31 · 10435 阅读 · 2 评论 -
pytorch训练深度学习网络设置cuda指定的GPU可见
cuda设置指定的GPU显卡可见训练原创 2022-06-08 09:44:02 · 1011 阅读 · 0 评论 -
torch.histc
在跑小样本分割ASGNet的时候,计算mIOU的时候,在中,使用到了torch.histc计算直方图:torch.histc的API:计算张量的直方图。元素被分类为 min 和 max 之间相等宽度的单元格。如果 min 和 max 均为零,则使用数据的最小值和最大值。小于最小值和高于最大值的元素将被忽略。Parameters:Returns解释:直方图箱为0、1、2、3;其中所以输出tensor([0, 2, 1, 0])原创 2022-06-01 10:28:49 · 2640 阅读 · 0 评论 -
pytorch中的双线性插值上采样(Bilinear Upsampling)、F.upsample_bilinear
在Fully Convolutional Networks for Semantic Segmentation这篇文章中,介绍到Bilinear Upsampling这种上采样的方式,虽然文章最后用的是deconvolution,给出的理由就是不希望upsampling filter是固定的= =!因为以前用的upsampling的方式是很简单的,比如放大两倍,就是把一个像素点复制一下变成四个。这样的做法会导致图像变得模糊。在介绍双线性插值前,先介绍一下线性插值。其实说白了就很简单,就是两点确定一条线转载 2022-05-31 21:56:53 · 9762 阅读 · 1 评论 -
pytorch nn.AdaptiveAvgPool2d(1)
在pytorch的PSPNet中网络构建有用到:其中参数为给定输出特征图的大小,其中通道数前后不发生变化。全局信息采用如下公式:原创 2022-05-31 21:52:47 · 987 阅读 · 0 评论 -
Pyramid Scene Parsing Network【PSPNet】论文阅读
论文:https://arxiv.org/pdf/1612.01105.pdfCode:Abstract场景解析对于不受限制的开放词汇和多样的场景来说是一项挑战。在本文中,我们通过我们的金字塔池化模块和提出的金字塔场景解析网络(PSPNet),通过基于不同区域的上下文聚合来探索利用全局上下文信息的能力。我们的全局先验表示可以有效地在场景解析任务中产生高质量的结果,而PSPNet为像素级预测提供了一个优越的框架。所提出的方法在各种数据集上实现了最先进的性能。它在2016 ImageNet场景解析挑战赛、原创 2022-05-30 22:45:24 · 610 阅读 · 0 评论 -
ASGNet论文和代码解读2
论文地址:Adaptive Prototype Learning and Allocation for Few-Shot Segmentation论文代码:ASGNetAbstract原型学习被广泛应用于少样本分割。通常,通过对全局对象信息进行平均,从支持特征(support feature)中获得一个单一的原型。然而,使用一个原型来表示所有的信息可能会导致歧义。在本文中,我们提出了两个新的模块:超像素引导聚类(SGC)和引导原型分配(GPA),用于多种原型的提取和分配。具体来说,SGC是一种无参数和原创 2022-05-28 11:27:02 · 467 阅读 · 0 评论 -
[小样本分割]论文解读Prior Guided Feature Enrichment Network for Few-Shot Segmentation
论文:Prior Guided Feature Enrichment Network for Few-Shot Segmentation (arxiv.org)Code:PFENetAbstract最先进的sota语义分割方法需要足够的标记数据才能获得好的结果,如果不进行微调,很难处理看不见的类。因此,小样本分割被提出来学习一个仅通过少量样本就能快速适应新类别的模型。由于对训练类别高级语义信息的不当使用以及查询和支持目标之间的空间不一致,这些框架仍然面临着对不可见类泛化能力降低的挑战。为了缓解这些问题原创 2022-05-26 22:00:09 · 1837 阅读 · 0 评论 -
Feature Pyramid Networks for Object Detection论文理解
Abstract特征金字塔是识别系统中用于检测不同尺度目标的基本组成部分。但最近的深度学习对象检测器避免了金字塔表示,部分原因是它们是计算和内存密集型的。在本文中,我们利用深层卷积网络固有的多尺度金字塔层次结构来构造具有边界额外成本的特征金字塔。开发了一种具有横向连接的自顶向下体系结构,用于在所有尺度上构建高级语义特征图。这种称为特征金字塔网络(FPN)的体系结构作为通用特征提取器,在一些应用中展现了显著的提升。在一个基础的更快的R-CNN系统中使用FPN,我们的方法在COCO检测基准上实现了sota的单原创 2022-05-25 21:33:47 · 467 阅读 · 0 评论 -
[深度学习]激活函数(Sigmoid等)、前向传播、反向传播和梯度优化;optimizer.zero_grad(), loss.backward(), optimizer.step()的作用及原理
用Matt Mazur的例子,来简单告诉读者推导过程吧(其实就是链式)!先初始化权重和偏置量,得到如下效果:前向传播计算neth1=w*i+b通过激活函数计算outh1计算下一层的neth2、通过下一层的激活函数计算误差Etotal...原创 2022-05-25 16:25:09 · 2192 阅读 · 0 评论 -
衡量两个向量相似度的方法:余弦相似度、pytorch 求余弦相似度:torch.nn.CosineSimilarity(dim=1, eps=1e-08)
余弦相似度\color{red}{余弦相似度}余弦相似度在NLP的任务里,会对生成两个词向量进行相似度的计算,常常采用余弦相似度公式计算。余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。我们知道,对于两个向量,如果他们之间的夹角越小,那么我们认为这两个向量是越相似的。余弦相似性就是利用了这个理论思想。它通过计算两个向量的夹角的余弦值来衡量向量之间的相似度值。公式如下:参考:衡量两个向量相似转载 2022-05-23 16:25:14 · 3010 阅读 · 0 评论 -
python在列表、元素、字典、集合和numpy的数组前加上星号 * 的含义(resnet中的_make_layer函数中return容器带星号)
python在列表、元素、字典、集合和numpy的数组前加上星号 * 的含义示例:List = ['a', 2, 3]Tuple = ('b', 'c', 5)Dict = {'name': 'Ada', 'age': 23}print(List)print(Tuple)print(Dict)print(*List)print(*Tuple)print(*Dict)import numpy as npndarray = np.array([2, 3, 4])print(n转载 2022-05-23 15:31:17 · 827 阅读 · 0 评论 -
[小样本图像分割]SG-One: Similarity Guidance Network for One-Shot Semantic Segmentation
论文地址:SG-One: Similarity Guidance Network forOne-Shot Semantic SegmentationCode地址:SG-OneAbstract小样本图像语义分割是一项具有挑战性的任务,即仅使用一个注释示例作为监督,从未见过的类别中识别目标区域。在本文中,我们提出了一种简单而有效的相似性引导网络来解决小样本分割问题。我们的目标是参考同一类别的一个密集标记的支持图像,来预测一个查询图像的分割掩码。为了获得支持图像的鲁棒代表性特征,我们首先采用掩码平均池化(原创 2022-05-22 10:27:33 · 1251 阅读 · 1 评论 -
Swin Transformer
一、timm库中的swin transformer它的forward_features和forward函数:输入x先经过x = self.patch_embed(x)经过基础块x = self.layers(x)【SwinTransformerBlock类在BasicLayer类中用到了,而PatchMerging类和BasicLayer类也在SwinTransformer类中用到了,所以最后都在SwinTransformer类中的forward中出现了】...原创 2022-05-06 21:27:30 · 504 阅读 · 1 评论 -
Transformer 优秀开源工作:timm 库 vision transformer 代码解读
timm库(PyTorchImageModels,简称timm)是一个巨大的PyTorch代码集合,已经被官方使用了。原创 2022-05-04 11:26:05 · 6041 阅读 · 2 评论 -
ASGNet论文和代码解读
原文链接:ASGNet论文开源代码:ASGNet-main网络结构:一原创 2022-04-28 11:03:25 · 4706 阅读 · 5 评论 -
PFENet数据加载、训练、pascal5i不同的5类验证测试、添加训练曲线函数
一、数据加载dataset1.1 class SemData(Dataset):中的__init__函数:最后进行了一个make_dataset操作make_dataset函数最后返回image_label_list, sub_class_file_listimage_label_list中包含一个2007_000039.jpg原图和2007_000039.png的mask:1.2 __len__函数:`def len(self): return len(self.data_list原创 2022-04-27 10:15:24 · 4126 阅读 · 26 评论 -
semseg-master加载数据、训练和计算mIOU
semseg-master的github链接:semseg一、数据处理在制作dataset的时候,label直接读取label = cv2.imread(label_path, cv2.IMREAD_GRAYSCALE) # GRAY 1 channel ndarray with shape H * W调试代码发现读取的是file:///media/D_4TB/zhouhongjie/1.few-shot%20segmentation/3.CaNet/CaNet-master/dataset原创 2022-04-26 10:01:11 · 536 阅读 · 0 评论 -
小样本图像语义分割综述
这些小样本分割方法都是利用基于度量的元学习思想,根据其度量工具是否有需要学习的参数,本文将这些小样本分割方法分为两种类型:基于参数结构的小样本分割模型和基于原型结构的小样本分割模型。基于参数结构\color{red}{基于参数结构}基于参数结构的小样本分割算法利用或设计许多卷积结构来提高感受野或捕捉上下文信息和空间信息,在语义信息量大的数据集上的性能优于基于原型结构的方法。但是过多的卷积结构使模型容易出现过拟合的现象。基于原型结构\color{red}{基于原型结构}基于原型结构的小样本分割算法利用无参原创 2022-04-12 15:17:31 · 5187 阅读 · 4 评论 -
PFENet-master、SegmentationClassAug.zip label
一、数据加载1.1 分割训练集数据和val数据文件夹train.txt有1464张图片(用于训练和验证集),文件夹val.txt有1449张图片(用于测试集)。也即是Pascal/VOCdevkit/VOC2012/ImageSets/Segmentation/train.txt和val.txt:SegmentationClassAug.zipVOC2012增强数据集label文件,包含已经处理好的12031张灰度图片。这个是Semantic Boundaries Dataset的数据集,原创 2022-04-11 16:22:44 · 553 阅读 · 3 评论 -
在python中打印多个参数print()
一、使用%例:以元组的形式传递:print("Total score for %s is %s" % (name, score))把它当作字典:print("Total score for %(n)s is %(s)s" % {'n': name, 's': score})二、使用新样式的字符串格式:print("Total score for {} is {}".format(name, score))...原创 2022-04-07 17:13:17 · 4309 阅读 · 0 评论 -
CaNet-master装载图片数据和mask(index对应单张图片序号)
一、数据处理1. 数据集文件夹:2. Dataset和Dataloader:首先自定义Dataset类重写__getitem__方法:index对应单张图片序号,batch_size不同也可能取到不同的类:1way−1shot\color{red}{1 way-1shot}1way−1shot# loading data# trainsetdataset = Dataset_train(data_dir=data_dir, fold=options.fold, input_size=inpu原创 2022-04-04 11:09:08 · 5333 阅读 · 1 评论 -
8位, 16位,24位,32位图片显示原理及对比、读自己的mask、判断是否为灰度图
一、8位, 16位,24位,32位图片显示原理及对比我们都知道一张图片可以保存为很多种不同的格式,比如bmp/png/jpeg/gif等等。这个是从文件格式的角度看,我们抛开文件格式,看图片本身,我们可以分为8位, 16位, 24位, 32位等。单击右键,属性->详细信息即可查看图片位深度\color{red}{图片位深度}图片位深度:8位: 2^8 = 2^2(B) 2^3(G) 2^3® = 256 (256色) 可以总共显示256种颜色16位: 2^16 = 2^5(B) 2原创 2022-04-01 10:58:27 · 10366 阅读 · 0 评论 -
手把手教你使用Yolov5制作并训练自己的数据集
目录1.数据集制作1.1 labelme安装使用2.数据集与模型配置2.1存放数据集2.2 修改data->XYB.yaml和LabelmeToXYB.py的参数2.3配置环境和下载模型所需的依赖3.训练和测试3.1训练3.2测试程序使用教程使用的yolov5代码存放在了百度网盘:链接:https://pan.baidu.com/s/15za5jbdWwne2O1-AT4DgSg提取码:2xic1.数据集制作1.1 labelme安装使用..原创 2021-10-20 20:18:03 · 9975 阅读 · 3 评论 -
语义分割数据集图像映射、ValueError: Target size (torch.Size([4, 20, 320, 320])) must be the same as input size (
在处理语义分割数据集时需要将RGB的mask图像按照类别进一步处理成对应的灰度图。1.结果图以下图为例。把上图按像素点类别映射成灰度图,得到label图如下(由于灰度值是0-4,灰度值较小,所以肉眼看起来看不到区别):2.做法(RGBmask得到label灰度图):2.1 修改自己的Clss字典多类别的时候,指定自己的mask图每一种颜色(RGB值)代表什么类别。Cls = namedtuple('cls', ['name', 'id', 'color']) #..转载 2022-03-28 11:07:48 · 1969 阅读 · 0 评论 -
VNC死机的处理方法
目录1. 打开MobaXterm并登录2. 连续输入以下命令:1. 打开MobaXterm并登录2. 连续输入以下命令:conda deactivate# 回车vncserver -kill :3# 回车vncserver# 回车之后打开VNC发现就可以发现已经重启成功了:...原创 2021-11-09 15:13:33 · 2862 阅读 · 0 评论