自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(249)
  • 资源 (6)
  • 收藏
  • 关注

原创 【pytorch】关于OpenCV和PIL.Image读取图片的区别

具体来说这两种方式读取图片没有大的区别,但是建议用的方式来读。

2024-05-22 19:57:52 229

原创 【学习】CBAM注意力机制,CBAM+Resnet代码实现。

CBAM是结合了通道和空间信息的注意力机制。

2024-05-20 20:52:35 244

原创 【学习】SE注意力,SEresnet代码实现。

SE是一个通道注意力机制。这里的代码是只提取出了resnet的后三层。

2024-05-20 20:50:13 127

原创 【学习】实验室服务器常用的Linux指令。

ls 是英文单词 list 的简写,其功能为列出目录的内容,是用户最常用的命令之一,类似于 DOS下的 dir 命令。查看当前服务器上运行的所有进程,用于查看自己的进程有没有卡死一直占着GPU的情况。用 gzip 压缩 tar 打包后的文件,其扩展名一般用 xxx.tar.gz。tar 与 gzip 命令结合可以使用实现文件 打包和压缩。在不同操作系统中,常用的打包压缩方式是不同的选项 含义。使用 rm 命令要小心,因为文件删除后不能恢复。tar 只负责打包文件,但不压缩。Linux 下文件和目录的特点。

2024-05-20 17:03:02 415

原创 【学习记录】torch.chunk()函数用法

torch.chunk 是 PyTorch 中一个用于将张量沿指定维度分割成多个子张量的函数。它对于处理需要均匀分割的张量非常有用。以下是 torch.chunk 的详细介绍,包括其语法、参数、返回值和示例。

2024-05-16 09:59:27 313

原创 【代码复现】Ultra-Fast-Lane-Detection-V2 代码复现。

GitHub源码:https://github.com/cfzd/Ultra-Fast-Lane-Detection-v2?按照install.md复现遇到的问题:这行命令有问题,先跳过。

2024-04-25 16:38:21 304

原创 【学习】服务器解决:重新分配同样端口号后,连不上VScode

清除本地 SSH 缓存中与远程主机相关的条目可以通过编辑 known_hosts 文件来实现。这个文件包含了您曾经连接过的远程主机的公钥信息。原来服务器分配的环境有问题,重新分配了一下。还是同样的端口号,Xshell和xftp能够连接上,但是VScode连接不上。在 Windows 上,known_hosts 文件通常位于用户的 .ssh 目录下。将以前的端口号那一行删除即可。例如此处删除103。打开后,会发现里面有已经缓存过的端口号及密匙。删除之后,VScode再重新连接即可。

2024-04-23 20:45:12 341 2

原创 【解决---车道线检测 UFLD 算法 没有这样的文件或目录 /txt/out0_normal.txt‘】

此工具需要 OpenCV C++。请按照此处安装OpenCV C++。构建 OpenCV 时,请从 PATH 中删除 anaconda 的路径,否则会失败。如果您只想训练模型或制作演示,则不需要此工具,您可以跳过此步骤。如果要在CULane上获取评估结果,则应安装此工具。安装完成后,制作 OpenCV include path 的软链接。我们提供三种合规流水线来构建CULane的评估工具。安装 CULane 评估工具(仅测试时需要)。首先,您需要安装OpenCV C++。

2024-04-18 19:46:21 226 1

原创 【问题解决】ModuleNotFoundError: No module named ‘nvidia‘:

复现Ultra-Fast-Lane-Detection-v2道路标线检测。

2024-04-17 19:04:27 289

原创 【学习】VScode修改侧边栏大小。

侧边栏不可以直接更改,所以先缩放整体界面,再改变工作区大小。可以通过调整参数,找到自己喜欢的。

2024-04-12 11:09:31 515

原创 【学习】使用VScode连接服务器。

选择 platform时候,选择使用 Linux,而不是windows。进入步骤2中,进行文件配置。

2024-04-09 20:49:45 292

原创 【学习 在服务器上使用bypy直接下载百度云盘的资源。

bypy list 显示百度网盘 /apps(我的应用数据)/bypy 目录下的所有文件。此时先在百度网盘中,将需要上传的文件移动到。此时会显示隐藏的文件夹,然后再使用命令删除。可以看到现在百度网盘中的使用情况。使用以上命令即可删除。

2024-04-09 20:42:34 511

原创 【学习】注意力机制(Attention)和 自注意力机制(self-Attention)

我们还得进行一个汇总,当你使用 Q 查询结束了后,Q 已经失去了它的使用价值了,我们最终还是要拿到这张图片的,只不过现在的这张图片,它多了一些信息(多了于我而言更重要,更不重要的信息在这里)。这样的话,就得到了一个新的 V’,这个新的 V’ 就包含了,哪些更重要,哪些不重要的信息在里面,然后用 V’ 代替 V。这里的 its 做了自注意力,其包含了这句话所有词的信息,并且对Law的相似度最高,所以这里的its最有可能代表its。我(查询对象 Q),这张图(被查询对象 V),图中包含的模块(K)。

2024-04-07 21:41:47 909

原创 【学习】python标准库importlib.import_module,用于动态导入模块。

其实就类似于接收一个参数module_name, 通过接收不同module_name 的值,从而实现动态导入模块。

2024-03-26 16:50:07 581

原创 【学习】python 的numpy 中linspace函数

通过定义均匀间隔创建数值序列。其实,需要指定间隔起始点、终止端,以及指定分隔值总数(包括起始点和终止点);最终函数返回间隔类均匀分布的数值序列。总结:用法简单,就是在start和stop之间,按照等间距生成num个数。具体间距是由num数决定的。

2024-03-25 16:41:03 247

原创 【学习】Python库addict,使用Dict 的类

使用 addict 库中的 Dict 类时,可以像访问对象属性一样访问字典的键值对。这在访问深层嵌套的字典时尤其方便。他只是编写代码的时候比传统字典访问要方便一些,其他的没有区别。

2024-03-25 16:05:51 423

原创 【学习】Python 标准库中用于解析命令行参数的argparse简介

argparse 模块是 Python 内置的用于命令项选项与参数解析的模块,argparse 模块可以让人轻松编写用户友好的命令行接口,能够帮助程序员为模型定义参数。大白话对上面代码进行解读,首先我们导入argparse这个包,然后包中的ArgumentParser类生成一个parser对象(其中的description对参数解析器的作用进行描述),当我们在命令行显示帮助信息的时候会看到description描述的信息。例如:python try.py -h。

2024-03-25 11:41:03 998

原创 【学习】python函数语法(面像对象、封装函数)

在Python中,一边循环一边计算的机制就是生成器(generator)。那么如何创建 generator 呢?方法一:把一个列表生成式的 [ ] 改成 ()。注:generator 也是可迭代对象,因此可以通过 for 循环来遍历迭代器中每一个元素。方法二:计算规则过于复杂,用列表生成式写不出来时,可以用函数实现。注:如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator。这里,最难理解的就是generator和函数的执行流程不一样。

2024-03-20 10:48:21 765

原创 【学习】pyhon中的functools.partial 函数

Python 标准库中的 functools.partial 函数。它的作用是创建一个新的函数,该函数是将。上述代码相当于,默认将。的第一个值设置为5.

2024-03-18 16:59:50 258

原创 【学习】目标检测中的anchor

每个网格都会有一个自己的中心,每个小格子都可以抽象成为在自己的中心生成了一个指定大小为16个像素的矩形框,在这里,我们把这些中心称之为”锚点“,把每个锚点处的框称之为”锚框“。

2024-03-15 17:24:51 361

原创 【学习】感受野

(receptive field)是指在神经网络中,某一层输出的特征图上的一个像素点对应输入图像的区域大小。在深度神经网络中,随着网络层数的增加,特征图的感受野也会逐渐增大。这是因为每一层的卷积操作都会扩大感受野。

2024-03-15 17:00:13 553

原创 【学习】PyTorch中的nn.Embedding的用法

其中 num_embeddings 是词表的大小,即 len(vocab);embedding_dim 是词向量的维度。nn.Embedding()产生一个权重矩阵weight,其shape为(num_embeddings, embedding_dim),表示生成num_embeddings个具有embedding_dim大小的嵌入向量;

2024-03-15 10:31:39 252

原创 【学习】python装饰器 decorator

最近有人问我装饰器是什么,我就跟他说,其实就是装饰器就是类似于女孩子的发卡。你喜欢的一个女孩子,她可以有很多个发卡,而当她戴上不同的发卡,她的头顶上就是装饰了不同的发卡。但是你喜欢的女孩子还是你喜欢的女孩子。而你的手机就变成了带手机壳的手机。装饰器就是python的一个拦路虎,你干或者不干它,它都在那里。如果你想学会高级的python用法,装饰器就是你这个武松必须打倒的一只虎。装饰器是给现有的模块增添新的小功能,可以对原函数进行功能扩展,而且还不需要修改原函数的内容,也不需要修改原函数的调用。

2024-03-14 11:16:44 734

原创 【学习】pytorch框架的数据管理—— 理解Dataloader

测试路径# 文件类型判断# 获取绝对路径# 罗列出文件夹下的所有文件名# 路径拼接""" 自定义数据集类 """pass""" 用于数据集中的样本获取 """return img""" 数据的数量 """# 创建数据集# 获取数据img.show()

2024-03-10 20:04:30 482

原创 【kaggle代码】Plant Seedlings Classification (使用Resnet-18完成分类任务)

的元组形式,在 PyTorch 的 DataLoader 中,元组列表中元素的数据类型要求相对较松。最后发现原因是:在提交submission中,图片名称是按照顺序读入的,但是在使用Dataloader读入测试集数据时,使用了。分类任务的数据是:【图片,标签(字符串类型)】,所以两者的数据读取方式不同。参数对读入的图像进行处理,而不对标签(字符串)处理,且会将标签自动转为标签索引形式。,导致读入的顺序被打乱,从而使得图片名称和预测标签不对应,导致得分很低。便于图像预处理,而在该分类任务中,不需要重写。

2024-03-10 11:18:35 427

原创 【学习】DLA (Deep Layer Aggregation)

本研究是有由UC Berkeley的Trevor Darrell组发表于2018年CVPR。因为,工作中应用到CenterNet,文章中使用了DLA作为backbone,能够以较高的速度完成推理并维持较高的AP。

2024-03-10 10:01:22 195

原创 【学习】DenseNet

DenseNet模型的基本思路与ResNet一致,但它建立的是前面所有层与后面层的密集连接(即相加变连结),它的名称也是由此而来。DenseNet的另一大特色是通过特征在通道上的连接来实现特征重用。这些特点让DenseNet的参数量和计算成本都变得更少了(相对ResNet),效果也更好了。ResNet解决了深层网络梯度消失问题,它是从深度方向研究的。宽度方向是GoogleNet的Inception。而DenseNet是从feature入手,通过对feature的极致利用能达到更好的效果和减少参数。

2024-03-07 11:43:19 339

原创 【学习】torch.nn.CrossEntropyLoss交叉熵损失函数

取单个样本举例, 假设x = [ 0 , 1 , 0 ] , 模型预测样本x ^的概率为[ 0.1 , 0.5 , 0.4 ]。会自动进行one-hot编码。这是因为在target中只会有一个类别为真,最终得到loss也只是会和真的这个类别相乘,故自动编码很容易。的input是没有归一化的每个类的得分,而不是softmax之后的分布。交叉熵损失,是分类任务中最常用的一个损失函数。中的标签target使用的是类别的序号,而不是one-hot形式。在torch中,输入的target只需要是类别序号即可,

2024-03-06 21:08:17 670

原创 【学习】torchvision.datasets.ImageFolder()

此时,我们想要获取图片和标签,标签即为文件名(class1、class2…)

2024-03-04 10:15:00 364

原创 【学习记录】Resnet

参考视频:https://www.bilibili.com/video/BV1cM4y117ob/?这就相当于我们这一层得到的输出最差都是和上一层一样的,因为在反向传播过程中是在做优化,最差的就是F(x)这里为0,既这一层不做改变。更直白的话来理解,经过残差块输出的信息至少是和上一层的信息一样多,所以可以做到越来越好。对于Resnet网络,就是由多个残差块组成的网络,因为理论上网络越深效果会越好。中间的卷积部分对输入的x进行操作,记为F(x)。可以发现,加入残差块和不加残差块的区别在于求导过程中多了一个。

2024-02-29 17:06:42 319

原创 【语法 布尔索引】将模型的预测结果 preds 转换为二进制格式 preds = (preds > 0.5).float()

首先看一个示例,该示例其实是通过布尔索引。

2024-02-27 11:11:27 696

原创 【Kaggle代码】Carvana Image Masking Challenge

Kaggle比赛链接:https://www.kaggle.com/competitions/carvana-image-masking-challenge。

2024-02-26 19:15:02 314

原创 【学习】pytorch中with torch.no_grad():和 model.eval()的区别

model.eval()和with torch.no_grad()的区别先给出结论: 这两个的所起的作用是不同的。

2024-02-21 20:22:25 547 1

原创 【问题记录】RuntimeError: CUDA error: no kernel image is available for execution on the device

以我自己为例:当前3090显卡与torch的版本不支持。问题是由于当前显卡与torch版本有冲突。

2024-02-19 21:05:52 467

原创 【学习】pytorch深度学习入门与实战——语义分割网络

【代码】【学习】pytorch深度学习入门与实战——语义分割网络。

2024-01-29 21:23:39 102

原创 【学习】傅里叶变换分析与理解

傅里叶级数的本质是,但是宇宙似乎并不是周期的。

2024-01-29 17:31:48 265

原创 【学习】训练时候优化的通常格式

损失函数loss是用于计算损失,并且进行反向传播。通过反向传播,可以得到梯度,从而使得优化器知道如何更新网络参数。故每次更新参数前,都需要先将上一次的梯度进行清零,以避免影响这一次的训练。通常的训练中格式如上。

2024-01-28 19:34:30 131

原创 【问题记录】RuntimeError: Input type (torch.cuda.FloatTensor) and weight type (torch.FloatTensor) should b

报错意思是说,模型和输入数据类型不匹配,模型在GPU上,而输入数据是在CPU上。

2024-01-28 18:24:07 107

原创 【代码】使用预训练的语义分割网络

【代码】【代码】使用预训练的语义分割网络。

2024-01-25 17:04:34 367

原创 【学习】基础知识

对于一张彩色图像,通常有三个通道(红、绿、蓝),每个通道都是一个二维矩阵。假设图像的高度为 H,宽度为 W,那么图像的维度表示为 (H, W, 3)。这里的 3 表示三个通道。对于灰度图像,只有一个通道,其维度表示为 (H, W)。

2024-01-25 11:03:51 392

CBAM+Resnet源码,SENet+Resnet源码

CBAM+Resnet和SENet+Resnet都是深度学习中用于图像分类任务的优秀模型。其中,CBAM是一种注意力机制模块,可以自适应地学习不同空间尺度下通道和空间注意力权重,从而提高特征表示的判别能力;SENet则是一种通道注意力机制,通过学习每个通道的重要性权重,进一步增强了特征的表达能力。 CBAM+Resnet源码和SENet+Resnet源码可以帮助你更好地理解这些模型的实现细节,并且可以基于这些代码进行进一步的研究和实验。这些代码可以通过Github等代码托管平台获取,包括网络模型定义、数据处理、训练和测试等部分。同时,这些代码也提供了各种参数设置和可视化工具,方便你进行模型调试和结果分析。 如果你对图像分类任务、深度学习算法感兴趣,那么CBAM+Resnet源码和SENet+Resnet源码都是非常有价值的资源。通过阅读这些代码,你可以学习到一些深度学习模型的实现技巧和注意力机制的应用方法。

2024-05-22

车道线检测CLRNet

车道线检测CLRNet源码,方便大家寻找使用,直接放这了。

2024-01-15

大数据可视化实验Seaborn和Matplotlib使用+包含ipynb源码和数据集。

实验内容包括 1.随机数生成、鸢尾花散点图,验证数据维度的增加,数据在它所占据的空间中越来越稀疏。 2. 柱状图、堆叠式柱状图,堆叠式面积图,箱形图(分别反映这四类消费群体的销售额的分布)、散点图(反映这四类消费群体的销售额分别和他们所给小费之间的相关性)、雷达图。3.泰坦尼克号Seaborn的各种方法对历史数据进行全面地可视化分析操作,以便能对哪些人可能生存进行比较和初步分析。可视化图表应设定各自的风格和缩放尺度

2022-07-08

Java汽车租赁系统+GUI界面实现+SQL+源码

Java汽车租赁系统+GUI界面实现+SQL。实现了与SQL的后台数据连接,可以使用GUI界面直接修改SQL数据库中的数据。有管理员、租户、注册三个主界面。实现了租车、修车、计算租金、上/下架车等功能。

2022-07-08

嵌入式原理之A8机器实现蜂鸣器、走马灯等控制操作代码

A8机器上实现蜂鸣器蜂鸣,走马灯的功能。嵌入式原理的大作业。

2022-07-08

Python小游戏外星人入侵

通过学习了python基本知识进行巩固提高的小游戏。可以通过键盘控制飞船移动,并且发射导弹急败外星人,从而获得分数。

2022-07-08

mplayer音乐播放器系统,附源码、图片、歌曲信息(包括歌词)可在ubuntu上使用

使用glade实现前端界面布局,通过代码读取歌曲信息并显示在界面中。实现了一个小型的音乐播放器。

2022-07-08

基于卷积神经网络的一个图片(芯片)识别。包含源码、所需图片。

学校人工智能课程学习中,使用到的图片识别案例。主要功能为识别芯片表面划痕

2022-07-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除