自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 问答 (1)
  • 收藏
  • 关注

原创 配置深度学习环境常用的链接

这是一篇链接整理的博客,不涉及环境配置的具体流程。

2025-02-26 17:03:30 145

原创 linux系统+拨号连网+VPN(L2TP)+集群+安装虚拟机+pycharm远程连接服务器上的虚拟机 流程概述

点击"IPv4 Settings"->"route"勾选下面两个选项,禁止自动获取路由,同时限制内网访问->ok->save。需要设置与共享密钥的话点击右下角“IPSec Settings…”,输入密钥,之后点击“ok”(因为是动态ip地址,所以每连一次VPN就要重新配置一次路由)点击create,输入对应的网关(内网的网关)、用户名和密码。打开设置->网络->选择刚才建立好的VPN进行连接即可。弹出的对话框左下角点击“+”,选择L2TP。,之后输入密码即可进入集群。连接好之后打开命令行输入。

2024-07-23 13:23:00 1072

原创 调试深度学习代码过程中的一些小问题

这篇博客提供的一种解决方法是更新pytorch版本,但考虑到pytorch版本要与cuda、NIVIA DRIVER版本对应,调整起来比较麻烦且可能会导致其他更严重的问题,所以放弃这个思路。

2024-03-19 12:02:13 529 1

原创 GeForce GTX 1080 Ti服务器搭建GPU加速环境

GeForce GTX 1080 Ti + NVIDIA 驱动470.239 + CUDA11.3 + python3.10 + pytorch1.10.0 + torchvision0.12.0 +kornia0.6.8 环境搭建

2024-03-01 02:50:52 1420 1

原创 使用坚果云实现Zotero文件同步

Zotero服务器提供的免费存储空间只有300MB大小,依靠它同步全部资源远远不够。此时就需要借助坚果云来间接扩展Zotero的存储空间。

2023-05-06 17:40:00 19674 9

原创 大模型幻觉

对于大模型出现幻觉,研究者们给出了基于信息流的解释:他们认为在生成的文本序列越来越长的同时,通常位于序列前段的 vision tokens 所提供的视觉信息会在 summary token 之间信息流动的过程中逐渐被稀释(因为一个 summary token 很难将序列中所有前文 token 所包含的信息都完整地记录)。研究者们将这一现象描述为 “partial over-trust”,并发现大模型的这种阶段性总结可能是导致幻觉问题的一大“元凶”!解决方案:惩罚-回退-再分配。

2025-05-20 21:41:44 170

原创 多头注意力机制和单注意力头多输出的区别

多头注意力得到的是一个 6×4 维的张量:我们有 6 个输入 token 和 4 个自注意力头,其中每个自注意力头返回一个 1 维输出。之前的自注意力一节也得到了一个 6×4 维的张量。增加单自注意力头的输出维度和使用多个注意力头的区别在于模型处理和学习数据的方式。尽管这两种方法都能提升模型表征数据的不同特征或不同方面的能力,但它们的方式却有根本性的差异。例如,多头注意力中的每个注意力头都可以学习关注输入序列的不同部分,捕获数据中的不同方面或关系。这种表征的多样性是多头注意力成功的关键。

2025-05-20 21:25:49 204

原创 CNN、RNN、Transformer对于长距离依赖的捕捉能力分析

2025-05-20 21:19:38 310

原创 ubuntu 20.04 ping baidu.coom可以通,ping www.baidu.com不通 【DNS出现问题】解决方案

如果以上命令的输出都正常,那么说明IPV6是没有问题的。那么问题就出在了DNS上。

2025-05-19 21:19:34 468

原创 模型集合(仅用于个人收集)

NAFNet(ECCV 2022)-图像修复论文解读工业异常分类VELMLIFT+

2025-05-16 16:22:29 200

原创 epic_kitchens_sounds数据集中对segment标签的处理:时间维度和特征维度的转换

假设:视频参数:fps=30,segments=2.0s(第2秒), 特征参数:num_frames=16,feat_stride=8。问题:60帧更接近第6个特征点的中心(6*8 + 8 = 56),但直接映射到7.5会导致错位。第6个特征点覆盖 [48, 64) 帧,中心在 48 + 8 = 56 帧。第7个特征点覆盖 [56, 72) 帧,中心在 56 + 8 = 64 帧。60帧 距离第6个特征点中心(56帧)更近,因此 6.5 是更合理的索引。epic_kitchens数据集中。

2025-05-09 18:34:41 286

原创 python setup.py install --user和pip install -e .的区别

【代码】python setup.py install --user和pip install -e .的区别。

2025-05-06 17:21:08 253

原创 不小心把当前的环境变量路径覆盖掉怎么办

配置环境变量(~/.bashrc)的时候没加:$PATH,导致之后只剩下刚刚配置的环境变量了。连vim都打不开。

2025-05-05 19:01:39 233

原创 相同IP和端口的服务器ssh连接时出现异常

把服务器上的一个虚拟机搞坏了,所以删除重新创建了一个,端口号和IP与之前的虚拟机相同。

2025-05-05 10:38:37 495

原创 大模型微调(PEFT)

利用PEFT包微调大模型

2025-04-14 18:08:33 983 2

原创 对于GroudingDINO的一些疑惑

【代码】GroudingDINO推理单张图片的后处理函数。

2025-04-10 20:53:28 186

原创 ssh密钥连接远程服务器并用scp传输文件

【代码】ssh密钥连接远程服务器并用scp传输文件。

2025-04-08 21:30:39 262

原创 RAGFlow部署时遇到的mysql unhealthy问题解决方案汇总

【代码】RAGFlow部署时遇到的mysql unhealthy问题解决方案汇总。

2025-03-27 20:32:58 990

原创 tensorboard报错MessageToJson() got an unexpected keyword argument

问题出在tensorboard 的 hparams 插件中,具体原因是 json_format.MessageToJson() 函数调用时传递了一个不被支持的参数 including_default_value_fields。通常是由于 protobuf 库的版本与 tensorboard 不兼容导致的。我的tensorboard是2.14.0,protobuf是5.x.x(忘记具体是多少了),后来换成了protobuf 4.25.6,问题就解决了。

2025-03-24 16:18:05 407

原创 计算机视觉--图像数据分析基本操作

cv-数据分析

2025-03-16 16:41:24 477

原创 深度学习分布式训练代码

【代码】深度学习分布式训练代码。

2025-03-16 12:59:09 149

原创 nnunet使用指定权重进行推理

nnunet用指定权重预测时报错。

2025-03-07 01:42:43 153

原创 os.walk()解释

os.walk()

2025-03-02 10:49:02 166

原创 全监督、半监督、弱监督、无监督

全监督、半监督、弱监督、无监督

2025-03-01 20:50:39 487

原创 nnUNetv2 中 force_use_labels的作用和含义

eg:你的数据集有3 个器官(肝脏、肾脏、脾脏),那么你的标签可能是:Organs (liver, kidney, spleen): [1,2,3]肝脏、肾脏、脾脏([1,2,3])

2025-03-01 10:11:30 156

原创 ImportError: cannot import name ‘GradScaler‘ from ‘torch‘

【代码】ImportError: cannot import name ‘GradScaler‘ from ‘torch‘

2025-02-26 14:47:39 488

原创 albumentations.Normalize

【代码】albumentations.Normalize。

2025-02-20 20:26:11 314

原创 OpenCV(4.11.0) /io/opencv/modules/imgproc/src/resize.cpp:3845: error: (-215:Assertion failed) !dsize

【代码】OpenCV(4.11.0) /io/opencv/modules/imgproc/src/resize.cpp:3845: error: (-215:Assertion failed)!dsize。

2025-02-20 18:36:57 507 2

原创 torch.nn.functional.conv1d

模块,是一个函数形式的接口。的卷积操作需求,或者在自定义复杂模块中需要精细控制卷积过程参数(如步长、填充、分组等)时使用。模块中定义的一个类,代表了一维卷积层(Layer)。它便于将卷积层作为神经网络架构中的一个组件进行管理、组合以及。groups:分组卷积(按照通道维数划分)dilation:表示的是空洞卷积。它属于PyTorch的。

2024-12-07 16:30:30 1143

原创 TransVG 代码配置及一些小细节

TransVG

2024-11-29 22:31:48 669

原创 Transformer中的Self-Attention机制如何自然地适应于目标检测任务

由于Self-Attention机制能够自然地捕捉特征图上的空间关系,并且这些关系可以被解释为潜在的bounding box,因此这对于目标检测任务是非常有利的。它允许模型在不需要额外处理或特殊层的情况下,就能够学习到物体的位置和形状信息。总的来说,这个观点强调了Transformer的Self-Attention机制与目标检测任务之间的自然联系,并解释了为什么Transformer在目标检测领域也取得了显著的成功。

2024-11-21 23:20:54 505

原创 调试QRNet遇到的问题(关于conda环境)

在虚拟环境中,conda list和pip list显示出来的有时是不一样的,conda list列出的是通过conda命令在该虚拟环境中安装的所有包;pip list显示的是通过pip命令在该虚拟环境中安装的 Python 包。/root/anaconda3/condabin是安装 Anaconda 时,它自动将一些关键的路径添加到PATH环境变量中。下面这些路径在系统安装时,系统安装程序就会在系统级的配置文件中配置这些路径。是没用的,必须返回到系统环境中source才行。虚拟环境中的安装包存放位置。

2024-11-21 19:03:51 292

原创 一些关于windows系统的问题

C:\Users\lenovo\AppData\Roaming\Microsoft\Windows\Start Menu\Programs此目录下存放的是软件的快捷方式

2024-11-13 11:42:48 327

原创 视频理解模型

视频分解成图片帧分别进行特征提取,最后把提取到的特征放到LSTM网络里提取时序信息。

2024-10-10 00:53:25 271

原创 配置anaconda环境变量的影响

配置虚拟机的过程:拉取一个配置为pytorch1.12.0-python3.7的docker镜像,创建虚拟机。创建好了之后验证了torch可以调用GPU。之后安装anaconda,并配置。问题:创建好虚拟环境之后,返回到虚拟机的基础环境中发现python版本不对,并且torch无法调用GPU,考虑是环境变量的问题,删掉之前配置的。python版本不对,并且torch无法调用GPU。环境变量,解决了这一问题。的环境变量,之后创建虚拟环境wyq。,显示找不到wyq这一虚拟环境。

2024-09-25 13:58:20 423

原创 Windows系统任务栏卡死

②win+R打开运行框 -> 输入regedit打开注册表 -> 地址栏输入 HKEY_LOCAL_MACHINE\SOFTWARE\Policies\Microsoft\Windows回车 -> 右键文件夹新建 “项” Windows Feeds-> 右键新建 “DWORD 32位” - > 右键重命名为 “EnableFeeds” -> 双击确定值为0 ->重启电脑发现没有了“资讯与兴趣”这一项。原因:“资讯和兴趣”组件的服务器在国外,国内无法正常访问。①右键任务栏 -> 资讯与兴趣 -> 关闭。

2024-09-18 11:22:43 710

原创 目标检测经典算法的个人理解

2、Fast-RCNN -> Faster-RCNN:从先选region再求Feature -> 先求Feature再选region。:最大的贡献在于用了Focal loss解决了类别不平衡问题。使得一阶段算法的准确度高于了两阶段。:RPN部分从用传统的算法 -> 用深度学习网络来实现。:VGG做backbone,加入多尺度特征图融合。

2024-09-16 21:12:20 493

原创 概率生成模型(Generative Models)和概率判别模型(Discriminative Models)

生成模型试图学习数据的分布,即数据是如何生成的。它们通过建模数据的联合概率分布来实现这一点。

2024-09-11 11:04:05 560

原创 image.size()和image.shape包含的信息一样,那image.size()存在的意义是什么?

在大多数情况下,当只需要获取张量的维度信息时,image.shape 和 image.size() 都是可以的,而且它们会给出相同的结果。在编写 PyTorch 代码时,选择哪一个主要取决于个人偏好和团队的编码标准。API 一致性:在 PyTorch 的许多地方,特别是在处理张量时,使用 torch.Size 可以保持 API 的一致性,使得代码更加清晰和易于理解。类型安全:torch.Size 是一个专门为表示张量维度设计的类型,它可以在 PyTorch 的内部和 API 中提供额外的类型检查。

2024-09-10 17:44:50 529

原创 PPT中的首行缩进和悬挂缩进

1、文本之前:指的是整段文本距离文本框左边界的距离2、度量值:指的是不同行之间的差值。

2024-08-12 10:59:38 1568

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除