深度学习
文章平均质量分 74
着重于CV的深度学习笔记
Thomas_Cai
One person go faster, a group of people can go further~
展开
-
Nvidia驱动莫名其妙不好使了?nvidia-smi报错?如何解决?已解决!!
Nvidia驱动莫名其妙不好使了?nvidia-smi报错?如何解决?已解决!!原创 2024-08-26 19:42:18 · 470 阅读 · 0 评论 -
经典骨干网络结构梳理(包括优缺点、适用场景)
在设计或修改网络时,往往要借鉴以往的经典网络结构,现把近几年经典的网络结构从优点、缺点和适用场景方面总结一下。原创 2024-08-26 19:36:13 · 624 阅读 · 0 评论 -
如何选取网络中间的输出?并极简方法可视化
选取网络中间特征输出并可视化原创 2024-08-14 17:11:47 · 520 阅读 · 0 评论 -
一文理解多标签分类损失函数ASL(Asymmetric Loss)
一文理解asl,从ce到focal loss到asl原创 2024-08-14 17:11:04 · 944 阅读 · 0 评论 -
深度学习中卷积算子和dropout算子的作用
卷积算子和dropout算子实战原创 2024-08-02 18:11:00 · 1087 阅读 · 0 评论 -
深度学习中降维的几种方法
深度学习中降维的几种方法原创 2024-08-02 17:39:22 · 1030 阅读 · 0 评论 -
激活函数汇总
常见激活函数汇总,包括函数、图像、优缺点、使用场景原创 2024-07-18 17:32:57 · 603 阅读 · 0 评论 -
模型训练中出现loss为NaN怎么办?
模型训练中出现loss为NaN原因原创 2024-07-18 16:06:05 · 1384 阅读 · 0 评论 -
安装mmcv-full报错:<command-line>: fatal error: /usr/local/cuda/include/stdc-predef.h: Permission denied
mmcv-full安装常见报错原创 2024-03-19 17:28:52 · 910 阅读 · 0 评论 -
python版tensorrt推理
windows10/11场景下,在python中进行tensorrt推理加速实践,模型推理加速必备~原创 2024-01-25 19:02:09 · 2629 阅读 · 3 评论 -
在windows安装python版本的tensorrt
windows10/11场景下,安装python的tensorrt包,推理加速必备原创 2024-01-25 18:47:57 · 1318 阅读 · 1 评论 -
【huggingface】【pytorch-image-models】timm框架中使用albumentations库数据增广
【huggingface】【pytorch-image-models】timm框架中使用albumentations库数据增广原创 2024-01-09 19:23:26 · 1167 阅读 · 0 评论 -
【炼丹神器】wandb实践之sweep超参扫描工具
训练之奇淫巧技sweep训练自动化搜索超参原创 2024-01-09 18:11:39 · 2047 阅读 · 0 评论 -
【计算机视觉网络训练技巧】你知道你拿什么图片在训练吗?训练图片可视化简易版
计算机视觉CV训练图片可视化三步简易实现原创 2024-01-03 11:52:58 · 467 阅读 · 0 评论 -
【huggingface】【pytorch-image-models】导入模型报错:ConnectionResetError: [Errno 104] Connection reset by peer
导入模型报错:ConnectionResetError: [Errno 104] Connection reset by peer原创 2023-12-29 11:15:43 · 1199 阅读 · 0 评论 -
自动数据增广论文笔记 | AutoAugment: Learning Augmentation Strategies from Data
谷歌大脑出品 | AutoAugment自动数据增广+timm包实践分析原创 2023-12-07 18:33:39 · 1024 阅读 · 0 评论 -
2023年度端侧transformer类分类力作SwiftFormer模型解读
2023 ICCV paper原创 2023-12-05 19:53:06 · 379 阅读 · 0 评论 -
nv驱动安装笔记
nvidia驱动安装原创 2023-11-13 10:33:14 · 264 阅读 · 0 评论 -
LLM大语言模型(典型ChatGPT)入门指南
llm学习笔记原创 2023-11-13 10:26:30 · 1310 阅读 · 1 评论 -
linux上在docker中使用anaconda创建虚拟环境
anaconda安装以及论文代码复现原创 2023-10-18 16:17:00 · 3054 阅读 · 0 评论 -
多标签分类论文笔记 | CAUSALITY COMPENSATED ATTENTION FOR CONTEXTUAL BIASED VISUAL RECOGNITION
视觉注意并不总是捕捉到稳健预测所需的基本对象表示。注意模块不仅倾向于强调目标对象,还倾向于强调模块认为对训练有帮助的共同发生的上下文。这个问题的根源在于环境的混淆效应,导致物体和预测之间不正确的因果关系,而视觉注意力又进一步加剧了这种情况。为了学习对上下文偏见具有鲁棒性的因果对象特征,我们提出了一种新的视觉识别注意模块——介入双重注意(IDA)。具体来说,IDA采用了具有多个采样干预的两个注意层,以补偿对混杂上下文的注意。请注意,我们的方法与模型无关,因此可以在各种backbone上实现。原创 2023-10-16 15:45:31 · 222 阅读 · 0 评论 -
多标签分类论文笔记 | (含代码复现,巨坑总结)Combining Metric Learning and Attention Heads...(MLD-TResNet-L-AAM/GAT+AAM)
多标签图像分类允许从给定图像中预测一组标签。与每个图像只分配一个标签的多类分类不同,这种设置适用于更广泛的应用程序。在这项工作中,我们回顾了两种流行的多标签分类方法:基于transformer的分类头和标签关系信息图处理分支。尽管基于transformer的分类头被认为比基于图的分支获得更好的结果,但我们认为,通过适当的训练策略,基于图的方法可以显示出很小的精度下降,同时在推理上花费更少的计算资源。在我们的训练策略中,我们引入了度量学习修正,而不是非对称损失(ASL),这是多标签分类的公认标准。原创 2023-10-13 16:31:22 · 2471 阅读 · 4 评论 -
多标签分类论文笔记 | ML-Decoder: Scalable and Versatile Classification Head
多标签分类论文精读笔记之ML-Decoder: Scalable and Versatile Classification Head原创 2023-10-12 16:15:12 · 2577 阅读 · 2 评论 -
cuda核函数编程小结
cuda核函数编程小结原创 2023-10-09 17:27:36 · 173 阅读 · 0 评论 -
在windows和linux上玩转Tensorrt
笔记系列,在CmakeLists中配置TensorRT,这一篇就够了!原创 2023-09-21 17:32:39 · 1100 阅读 · 0 评论 -
在ubuntu18.04上编译C++版本jsoncpp/opencv/onnxruntime且如何配置CMakelist把他们用起来~
这篇文章背景是笔者在ubuntu上编译C++代码,依赖一些包,然后需要编译并配置到CMakelist做的笔记。主要也是一直不太懂CMakellist,做个笔记以防忘记,也给读者提供一站式的参考,可能您需要的不是这几个包,但大同小异,再带上cmakelist加持,最后提供可视化远程调试教程,可以把C++玩的飞起。这篇文章将有以下内容:1. 安装编译一系列工具;2. 编译opencv;3. 编译jsoncpp;4. 编译onnxruntime;5. CMakelist配置;6. Clion远程调试C++原创 2023-09-13 19:30:42 · 3003 阅读 · 2 评论 -
基于VS平台编译带Cuda的OpenCV(内含版本以及整套方案含泪总结)
opencv4.7.0+cuda11.8+vs2019+win11+RTX3050原创 2023-09-08 19:17:59 · 824 阅读 · 0 评论 -
3D异常检测论文笔记 | Shape-Guided Dual-Memory Learning for 3D Anomaly Detection
我们提出了一个形状引导的专家学习框架来解决无监督的三维异常检测问题。我们的方法是建立在两个专门的专家模型的有效性和他们的协同从颜色和形状模态定位异常区域。第一个专家利用几何信息通过对局部形状周围的隐式距离场建模来探测三维结构异常。第二个专家考虑与第一个专家相关联的二维RGB特征来识别局部形状上的颜色外观不规则性。我们使用两位专家从无异常的训练样本中构建双记忆库,并进行形状引导推理以查明测试样本中的缺陷。原创 2023-09-06 23:48:22 · 1515 阅读 · 0 评论 -
从裸机开始安装ubuntu系统到安装NVIDIA驱动(包含ubuntu安装cuda)
不一样的是,安装好了之后,调为安全模式,然后在ubuntu系统进入的界面,选ubuntu不按Enter,也是按e,然后按照他的操作即可。“找到 quiet splash,删除 “$vt_handoff”,在后面添加 nomodeset,注意中间有个空格,然后按F10启动系统,就可以进入桌面了”spm=1001.2014.3001.5501。比较容易,也可参考:https://anandzhang.com/posts/linux/1。两个步骤,安装ssh,见参考1,配置ssh,见参考2。原创 2023-09-06 16:44:09 · 642 阅读 · 0 评论 -
异常检测 | CFA: Coupled-hypersphere-based Feature Adaptation for Target-Oriented Anomaly Localization
长期以来,异常定位在工业中得到了广泛的应用。以前的研究主要集中在逼近正态特征的分布,而不适应目标数据集。然而,由于异常定位需要精确区分正常和异常特征,缺乏适应可能会使异常特征的正常程度被高估。因此,我们提出了基于耦合超球的特征适应(CFA),它使用适应目标数据集的特征来实现复杂的异常定位。CFA包括(1)一个可学习的补丁描述符,它可以学习和嵌入面向目标的特征;(2)独立于目标数据集大小的可扩展内存库。原创 2023-08-26 19:04:40 · 1180 阅读 · 2 评论 -
异常检测 | EfficientAD: Accurate Visual Anomaly Detection at Millisecond-Level Latencies 毫秒级延迟的精准视觉异常检测
摘要:检测图像中的异常是一项重要的任务,特别是在实时计算机视觉应用中。在这个工作中,我们关注计算效率并提出处理图像的轻量级特征提取器在现代GPU上不到一毫秒。然后我们使用学生-教师方法检测异常特征。我们训练一个学生网络来预测所提取的特征正常的,即无异常的训练图像。在测试时检测异常是由于学生无法预测其特征。我们提出了一种训练损失,阻碍学生模仿教师特征提取器超出正常图像。它使我们大大降低了学生-教师模型的计算成本,同时提高了异常特征的检测。原创 2023-08-26 17:46:38 · 3493 阅读 · 0 评论 -
Anomalib:异常检测的深度学习库 -- 应用Anomalib训练自己的图片
其他参考资料:https://paperswithcode.com/paper/efficientad-accurate-visual-anomaly-detection。Github链接:https://github.com/openvinotoolkit/anomalib/blob/main/README.md。论文链接:https://arxiv.org/pdf/2202.08341v1.pdf。要训练自己的数据集,首先要知道原本数据集的格式。原创 2023-08-24 18:41:21 · 2825 阅读 · 0 评论 -
opencv常用API记录(C++版)
需要注意的是,在多线程环境下,确保线程安全,避免竞态条件和数据共享问题。函数可以更有效地利用多核 CPU 来处理图像,但也要确保你的操作是线程安全的。需要注意的是,并行处理的粒度要适当,避免过细的任务划分造成额外的线程开销。函数适用于并行处理单一循环范围,如果你想要并行处理双重循环并优化内层循环,可以将内层循环拆分成更小的任务单元,然后使用。是 OpenCV 库中的一个类,用于表示矩形区域的坐标和大小。对象上提取或复制一个新的矩形区域,并将该区域作为一个新的。的含义是根据给定的矩形区域,在原始。原创 2023-08-17 18:00:23 · 834 阅读 · 0 评论 -
VS2015+cublas实操记录(cuda加速GEMM矩阵乘加算子)
基于cv::gemm算子性能优化实操,尝试用cuda来加速gemm算子而采用cublas库。内附环境配置,以及实战代码。原创 2023-08-12 11:06:33 · 716 阅读 · 0 评论 -
pp-ocr报错记录
参考:https://stackoverflow.com/questions/67603407/distutilserror-could-not-find-suitable-distribution-for-requirement-parsesetu。原创 2023-08-03 12:38:52 · 339 阅读 · 0 评论 -
opencv常用API记录(python版)
是OpenCV中的一个函数,用于对图像进行Laplacian滤波处理,以检测图像中的边缘。Laplacian滤波器是一种二阶微分滤波器,它对图像的二阶导数进行计算,从而凸显出图像中的边缘或颜色变化区域。高斯模糊是一种常用的图像平滑滤波方法,它利用高斯函数对图像进行加权平均,降低图像的噪声和细节。是表示旋转矩形的参数,它可以是一个元组或一个包含4个浮点数的数组,表示旋转矩形的中心点坐标、宽度、高度和旋转角度。运行代码后,你将得到一个形状为(4, 2)的NumPy数组,其中每一行表示旋转矩形的一个顶点的坐标。原创 2023-07-20 12:38:25 · 526 阅读 · 0 评论 -
安装pycocotools报错“fatal error: Python.h: No such file or directory“ | 已解决
【代码】安装pycocotools报错“fatal error: Python.h: No such file or directory“ | 已解决。原创 2023-07-17 15:05:01 · 673 阅读 · 0 评论 -
labelme+sam在windows上使用指南
其实官网讲的很清楚了,这里做一个笔记,方便自己后面直接看。首先,贴一下官方的链接,作者老哥很强,respect!使用流程:资源:操作步骤:好。现在开始记录。原创 2023-07-15 17:24:42 · 2272 阅读 · 2 评论 -
关于多batch推理的一点思考
然后支持多batch的onnx模型转trt模型不要指定shape,指定optshape。然后推理trt模型,指定shape,这里指定shape不知道有没有效果,感觉没用,因为改变数字推理时间不会变长,应该是固定的用之前转trt的optshape在跑。最近要用nv卡跟其他卡对比多batch推理性能,调研后理了一下逻辑,记录一下,相关命令见我上一篇博文。最后看结果Throughtput为吞吐量,End-to-End的时间为跑完测试数据的平均时间,如果要算FPS,这里要Xbatchsize。原创 2023-07-07 17:34:59 · 662 阅读 · 0 评论 -
使用trtexec工具多batch推理tensorrt模型(trt模型)
/XXX/TensorRT-8.2.5.1/bin注意:得到:原创 2023-07-06 14:55:07 · 2164 阅读 · 0 评论