深度学习
文章平均质量分 82
深度学习框架,知识点,技巧等内容
追忆苔上雪
洛阳亲友如相问,就说我在学python
展开
-
R2O语义分割: Refine and Represent: Region-to-Object Representation Learning
区域到对象表示学习(Region-to-Object Representation Learning,R2O),它在预测分割掩码和使用这些掩码预训练编码网络之间振荡。R2O通过对编码特征进行聚类来确定分割掩码。R2O然后通过执行区域到区域的相似性学习来预训练编码网络,其中编码网络获取图像的不同视图,并将分割的区域映射到相似的编码特征。原创 2023-12-13 17:58:42 · 957 阅读 · 0 评论 -
Crowd Counting近期研究(附代码资源)
近期一些比较新的人群计数算法汇总,文中有代码资源原创 2023-12-25 21:34:01 · 935 阅读 · 0 评论 -
深度学习框架输出可视化中间层特征与类激活热力图
有时候为了分析深度学习框架的中间层特征,我们需要输出中间层特征进行分析,这里提供一个方法。原创 2023-12-28 14:25:14 · 702 阅读 · 0 评论 -
深度学习之自监督模型汇总(附代码资源)
我们引入了一种名为 BERT 的新语言表征模型,BERT 是双向编码器表征(Bidirectional Encoder Representations from Transformers)的缩写。与最近的语言表征模型(Peters 等人,2018a;Radford 等人,2018)不同,BERT 的设计是通过在所有层中对左右上下文进行联合调节,从未标明的文本中预训练深度双向表征。原创 2023-12-21 09:29:18 · 1062 阅读 · 0 评论 -
CV中的Attention机制:SENet
卷积神经网络(CNNs)的核心构建块是卷积算子,它使网络能够通过融合每层局部感受野内的空间和通道信息来构建信息特征。广泛的先前研究已经调查了这种关系的空间分量,试图通过提高整个特征层次的空间编码质量来增强CNN的代表能力。在这项工作中,我们转而关注通道关系,并提出了一种新的架构单元,我们称之为“Squeeze-and-Excitation”(SE)块,通过显式建模通道之间的相互依赖性,自适应地重新校准通道特征响应。原创 2023-12-13 16:05:51 · 393 阅读 · 0 评论 -
events.out.tfevents文件信息提取
深度学习训练数据有时候是记录在log文件中,文件名类型为events.out.tfevents.xxx.king,当然这些文件可以通过tensorbord工具可视化,这里提供一些events.out.tfevents文件信息提取的方法。原创 2023-12-13 14:57:11 · 1062 阅读 · 0 评论 -
空间金字塔池化(SPP,Spatial Pyramid Pooling)系列
空间金字塔池化的作用是解决输入图片大小不一造成的缺陷,同时在目标识别中增加了精度。空间金字塔池化可以使得任意大小的特征图都能够转换成固定大小的特征向量,下面针对一些典型的空间金字塔进行盘点。原创 2023-12-05 16:25:45 · 2037 阅读 · 0 评论 -
残差网络ResNet
当更深层次的网络能够开始收敛时,就会暴露出一个退化问题:随着网络深度的增加,精度会饱和(这可能并不奇怪),然后迅速退化。残差网络结构的提出,就是解决了随着网络层数的加深,出现的梯度弥散、梯度爆炸、以及网络退化的现象。原创 2023-12-01 16:18:17 · 375 阅读 · 0 评论 -
深度学习早停机制(Early Stopping)与早退机制(Early exiting)
早停机制,一种机器学习模型调优策略,提升调优效率下图损失值明显经过了欠拟合到过拟合使用早停机制后,模型不再过拟合模型早停是面向模型训练过程的。而在模型内部,也会出现类似的现象,这一现象被叫做过度思考(Overthinking)现象,好比爱迪生让助理计算灯泡的容积。一个博士生助理将问题过度复杂化,计算半天计算不出来。而一个头脑清晰的普通助理反而可以直接用灯泡能容纳的水量,很快就计算出容积。原创 2023-11-28 18:01:19 · 2593 阅读 · 0 评论 -
卷积神经网络经典backbone
特征提取是数据分析和机器学习中的基本概念,是将原始数据转换为更适合分析或建模的格式过程中的关键步骤。特征,也称为变量或属性,是我们用来进行预测、对对象进行分类或从数据中获取见解的数据点的特定特征或属性。原创 2023-11-26 22:07:02 · 746 阅读 · 0 评论 -
RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0
gt来自label,但是这里数据没有输入模型处理,发现下面遍历数据的代码image输进了device,但是gt没有。这行代码中涉及待两个变量,一个是predict,一个是gt。沿着gt寻根溯源,一路翻到Dateset处理代码,定位到报错位置,发现是如下代码。利用下述代码查看两个变量所属的。发现gt这个变量是在cpu上的。原创 2023-11-25 16:04:25 · 395 阅读 · 0 评论 -
自监督LIGHTLY SSL教程
Lightly SSL 是一个用于自监督学习的计算机视觉框架。以下内容主要来自Documentation,部分内容省略,部分专业名字不翻译,主要复现。原创 2023-11-24 11:03:35 · 2261 阅读 · 0 评论 -
深度学习之自监督模型汇总
现有的基于深度学习的遥感图像语义分割方法需要大规模的标注数据集。然而,分割数据集的标注往往过于耗时和昂贵。为了减轻数据标注的负担,最近出现了自监督表示学习方法。然而,语义分割方法需要同时学习高层和低层特征,但现有的大多数自监督表示学习方法通常只关注一个层次,这影响了遥感图像的语义分割性能。为了解决这个问题,我们提出了一种自监督多任务表征学习方法,以捕捉遥感图像的有效视觉表征。我们设计了三个不同的前置任务和一个三重连体网络来同时学习高层和低层图像特征。原创 2023-11-21 15:02:27 · 565 阅读 · 0 评论 -
深度学习领域中的耦合与解耦
在阅读论文的时候应该会看到两个操作,一个是耦合,一个是解耦,经常搭配着出现的就是两个词语,耦合头(Coupled head)以及Decoupled head(解耦合头),那为什么要耦合,又为什么要解耦。原创 2023-11-20 15:54:21 · 930 阅读 · 0 评论 -
colormap与colorbar应用
在做一个项目的时候,需要gridspec.GridSpec生成多子图,其中还涉及到热力图,colorbar单独生成,这里做一个分享,鉴于项目隐私,隐去了一些信息,自己在写的时候可以根据注释调整代码。常用的COLORMAP_JET效果如下,该模式常用于生成热力图。最终子图显示如下,部分关键信息隐去,请谅解。colorbar所有色带如下。原创 2023-11-15 11:30:59 · 377 阅读 · 0 评论 -
灰度图处理方法
做深度学习项目图像处理的时候常常涉及到灰度图处理,这里对自己处理灰度图的方式做一个记录,后续有更新的话会在此更新。原创 2023-11-15 11:17:40 · 507 阅读 · 0 评论 -
Variations-of-SFANet-for-Crowd-Counting可视化代码
本次对其中两个可视化代码进行梳理。原创 2023-10-30 10:13:07 · 217 阅读 · 0 评论 -
卷积神经网络的感受野
需翻墙。原创 2023-10-24 15:39:18 · 367 阅读 · 1 评论 -
Variations-of-SFANet-for-Crowd-Counting记录
论文:Encoder-Decoder Based Convolutional Neural Networks with Multi-Scale-Aware Modules for Crowd Counting论文链接:https://arxiv.org/abs/2003.05586源码链接:GitHub - Pongpisit-Thanasutives/Variations-of-SFANet-for-Crowd-Counting: The official implementation of "Encod原创 2023-10-13 15:16:35 · 363 阅读 · 0 评论 -
基于点标签的目标检测与计数深度学习框架盘点
9]中的研究表明,在MCNN[5]的每个列结构中学习的特征几乎相同,并且当网络深入时,训练这种架构是无效的。起dkNN(pi)像素的距离,其中dkNN(pi)表示 pi 的 k 个近邻点的平均距离,δ的典型值为0.5,如蓝色圆圈所示,这意味着该区域内大多数像素的最近GT点应该是pi。卷积滤波器的可视化。图中红色表示预测结果,绿色表示人工注释,顶端表示基于密度图的方法,可以看到无法准确预测个体的准确位置,中间表示使用锚框标注,基于检测的方法,容易导致检测目标缺失,尤其是使用NMS(非极大值抑制)的过程。原创 2023-10-10 18:15:12 · 697 阅读 · 0 评论 -
语义分割,实例分割,全景分割梳理
语义分割(semantic segmentation)实例分割(instance segmentation)全景分割(Panoptic Segmentation)下面基于这篇论文进行这几个概念的梳理论文提出并研究了一个称之为全景分割(Panoptic Segmentation,PS)的任务。全景分割统一了语义分割(为每个像素分配一个类标签)和实例分割(检测和分割每个对象实例)这两个典型的不同任务Figure 1. 给定图像(a);标签如(b)为语义分割(每个像素的类别标签);原创 2023-10-08 11:03:25 · 504 阅读 · 0 评论 -
P2PNet-Soy原理梳理
前文总结了P2PNet源码以及P2PNet-Soy源码实现方法,相关链接如下:现在梳理一下P2PNet-Soy原理。原创 2023-09-25 15:54:09 · 641 阅读 · 3 评论 -
Pytorch-YOLOv4梳理——原理和复现
首先说一点,就是yolov4的分支有点多,先梳理一下出现的顺序。提出了然后针对YOLOv4的模型缩放(model),提出了针对低端、一般、高端GPU分别设计了3个模型,再说一点,论文给的网站,要拖到下面才能找到pytorch版本的代码。原创 2023-09-15 12:04:41 · 436 阅读 · 0 评论 -
YOLO总结,从YOLOv1到YOLOv3
YOLOv1论文链接:https://arxiv.org/abs/1506.02640检测原理将检测问题转换成回归问题,一个CNN就搞定。即得到一个框的中心坐标(x, y)和宽高w,h,然后作回归任务。B是两个框,5是指参数量,x y w h是确定框的位置,c是置信度的值YOLOv2论文链接:https://arxiv.org/abs/1612.08242检测原理--相对yolov1的改进yolov2中使用了K-means聚类原创 2023-09-08 15:30:49 · 174 阅读 · 0 评论 -
FSC147数据集格式解析
FSC147是由147个对象类别组成的数据集,其中包含6000多张图像,适用于少镜头计数(few-shot)任务,少镜头计数大致框架可见下图。图像用两种类型标签,即点和边界框,它们可以用于开发少镜头计数模型。少镜头计数(few-shot)的大致框架图。原创 2023-08-22 13:48:35 · 1090 阅读 · 5 评论 -
万字长文解析深度学习中的术语
集成模型是一种机器学习方法,在预测过程中结合多个其他模型。这些模型称为基本估计器。集成模型提供了一种解决方案来克服构建单个估计器的技术挑战。原创 2023-08-02 16:13:50 · 1333 阅读 · 0 评论 -
深度学习之tensorboard可视化工具
跟踪和可视化指标,例如损失和精度可视化模型图(操作和层)查看权重、偏差或其他张量随时间变化的直方图将嵌入投影到低维空间显示图像、文本和音频数据分析 TensorFlow 程序以及更多。原创 2023-08-01 10:46:20 · 1933 阅读 · 0 评论 -
等分切割图片的方法
在做数据集的过程中,有时候需要将大图进行切分成小图片,一方面是为了满足训练需要,一方面是为了扩增数据集。市面上也有等分切割图片的软件或者网站,但是我比较懒,又想批量处理,所以这里分享一个等分切割图片的方法。如下图的尺寸为5472x3648,但是我用不着这么大的图片,需要将图9等分。可以看到已经将三张图片切割成了27张图,切割完成的图片尺寸也是正常的。原创 2023-07-28 10:09:29 · 260 阅读 · 0 评论 -
数据集汇总合集(持续更新ing)
数据集是深度学习的重要组成部分之一,但是找数据集是真的让人头大,于是本人整理了一下看论文过程中碰到开源数据集,整理不易,请多多点赞收藏,要是各位小伙伴有开源数据也可以在评论区分享,积攒了一定的数量我就会更新的,要是表中缺失的信息,好心的小伙伴能否补充,也欢迎评论区留言。原创 2023-07-21 18:08:27 · 84 阅读 · 0 评论 -
如何寻找开源代码
朋友们好啊,我是混元形意太极门掌门人马宝国,刚才有个朋友问我马老师发生肾摸事了(对不起,走错片场了)昨天看到两篇SCI一区论文,一个影响因子3点几坤,一个影响因子差不多4坤。(对不起,还是走错了)说回正轨,今天总结以下如何寻找论文的开源代码,没有源码的论文,新手小白看完,可能也只是看完,要通过论文复现功能,这几乎是做不到的事情,新手想通过开源代码练手,就需要找到合适的开源模型,起码自己先跑通了才能有点成就感,好,直接开整。原创 2023-07-20 20:25:00 · 2787 阅读 · 0 评论 -
Pytorch框架中各文件的作用
新人在接触Pytorch以及深度学习等领域时,面对一个开源的代码可能无从下手,一个Pytorch框架相对比较负责,文件也多,其中的逻辑不免让初学者感到不知所措,下面大致梳理一下Pytorch各文件夹的作用和逻辑,其中的细节还是需要多实践才能了解。原创 2023-07-19 16:51:04 · 1605 阅读 · 0 评论 -
SAHI: Slicing Aided Hyper Inference
目标检测和实例分割是目前计算机视中最重要的应用领域。然而,在实际应中,小目标的检测和大图像上的推理仍然是主要的问题,SAHI 来帮助开发人员用许多视觉实用工具克服这些现实世界的问题目标检测是指对图像中存在的所有目标进行识别和正确标记的方法。这大致包括两个步骤1目标定位:在这里,以尽可能紧的方式确定包围框或包围区域,以确定物体在图像中的确切位置。2:图像分类:本地化的对象,然后馈送到一个分类器,该分类器标记的对象。它是指将给定图像中的每个像素链接到特定类别标签的过程。原创 2023-07-19 14:07:51 · 1102 阅读 · 4 评论 -
p2p大豆计数模型
parser.add_argument('--output_dir', default='output_dir', # 存放输出日志default='checkpointds_dir', # 存放权重路径default='tensorboard_dir', # 存放训练阶段和评估阶段loss值parser.add_argument('--data_root用于存放数据集路径parser.add_argument('--output_dir用于存放 输出日志。原创 2023-07-18 09:34:19 · 474 阅读 · 2 评论 -
作物计数方法之合并信息生成json标签的方法
在研究农情的方向中,作物计数是一个很重要的方向,前文已经提到了一些要使用的方法在研究计数过程中,还需要将上文处理过的数据信息存入json文件方便后续使用,这里参考FSC147数据集的json文件写了一个脚本传入我们上述获得文件信息。原创 2023-07-07 19:40:47 · 559 阅读 · 2 评论 -
作物计数方法汇总
在研究农情的方向中,作物计数是一个很重要的方向,需要用到很多方法,这里做一个小小的总结。原创 2023-07-05 20:52:21 · 269 阅读 · 0 评论 -
crowdcountingp2p代码复现(续)
Path("D:\\P2PNET_ROOT\\crowd_datasets\\SHHA\\DATA_ROOT\\train\\images")] # 图片路径Path("D:\\P2PNET_ROOT\\crowd_datasets\\SHHA\\DATA_ROOT\\train\\train_file")] # txt路径result_png_list = r"D:\P2PNET_ROOT\crowd_datasets\SHHA\DATA_ROOT\train.txt" # 要写到哪个文件中。原创 2023-07-04 20:59:15 · 538 阅读 · 2 评论 -
crowdcountingp2p代码复现
前面学习了一下论文:Improved Field-Based Soybean Seed Counting and Localization with Feature Level Considered该论文的模型原型由CrowdCounting-P2PNet改进而来这里先复现一下CrowdCounting-P2PNet模型,然后再学习P2PNet-Soy模型。原创 2023-07-03 20:59:08 · 971 阅读 · 1 评论 -
PyTorch学习记录(二)
下面展示一下怎么在PyTorch中构建一个简单的卷积神经网络。原创 2023-06-13 21:33:21 · 138 阅读 · 0 评论 -
PyTorch学习记录
数据集是一个csv文件,打印一下数据集可以看到数据集的信息数据表中*year, moth, day, week分别表示的具体的时间*temp_2:前天的最高温度值*temp_1:昨天的最高温度值*average:在历史中,每年这一天的平均最高温度值*actual:这就是我们的标签值了,当天的真实最高温度*friend:这一列是凑热闹的,朋友猜测的可能值,咱们不管它就好了相关代码解析使用pandas做数据处理的第一步就是读取数据,数据源可以来自于各种地方,csv文件便是其中之一。原创 2023-06-09 22:13:54 · 159 阅读 · 0 评论 -
opencv学习记录(三)
因为需要学习,所以系统的过一遍注:到这一篇,opencv部分的流程过了一般,下一篇将开始PyTorch课程的流程。原创 2023-06-07 22:26:49 · 247 阅读 · 1 评论