自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(380)
  • 资源 (19)
  • 问答 (1)
  • 收藏
  • 关注

原创 基于ram++与groundingdino实现对图像自动检测

基于ram++算法与groundingdino可以实现对图像自动检测,ram++项目中也分享了与grounded-SAM连用的效果。这里对开源代码进行集成,实现ram++算法与groundingdino的连用。

2024-08-17 11:00:45 660

原创 项目简介:pyiqa-sal | 图像质量评价代码库

这是一个纯python和pytorch编写的图像质量评估工具箱,提供了许多主流全参考(FR)和无参考(NR)指标的重新实现(如果有的话,结果会用官方matlab脚本校准)。借助GPU加速,我们的大多数实现都比Matlab快得多。同时也比torch实现的方法在调用上更加方便。

2024-08-17 09:55:51 793

原创 pytorch 47 模型剪枝实战|基于torch-pruning库代码对yolov10n模型进行剪枝

torch-pruning官方提供了基于yolov8的剪枝代码,基于此代码改进博主实现了对yolov10n模型的剪枝。虽然实现了对yolov10n模型的剪枝,剪枝目标为移除60%的通道,然而实验是失败的,针对coco数据集进行操作,剪枝前的模型map时37,剪枝后只能恢复到22,比预计下降了15个点,剪枝后的模型flop是下降了很多,mac从8.9降低到2.01616 G,但在3060显卡上推理速度并未得到提升。下一期,将会实现模型的稀疏化训练与剪枝。本期实验,主要验证了多次剪枝,不如一次剪枝到位;

2024-08-11 21:30:03 72

原创 项目分析:RAM++ | Open-Set Image Tagging with Multi-Grained Text Supervision

发表时间:2023年11月16论文地址:https://arxiv.org/pdf/2310.15200项目地址:https://github.com/xinyu1205/recognize-anythingrecognize-anything项目是Open-Set Image Tagging with Multi-Grained Text Supervision论文(RAM++)算法对应的开源项目,其中有RAM++、RAM、Tag2Text 3个算法的运行代码。

2024-08-11 20:36:16 1015

原创 项目快过(图像超分|知识蒸馏)| SRModelCompression | Compressing Deep Image Super-resolution Models

项目地址:https://github.com/Pikapi22/SRModelCompression论文地址:https://arxiv.org/pdf/2401.00523发表时间:2024年2月21日深度学习技术已被应用于图像超分辨率(SR)领域,在重建性能方面取得了显著的进展。现有的技术通常采用高度复杂的模型结构,这将导致较大的模型规模和缓慢的推理速度。这往往导致高能耗,并限制了其在实际应用中的采用。

2024-07-28 22:25:02 1055

原创 模型剪枝实战|基于torch-pruning库代码对yolov8进行剪枝

torch-pruning库是一个开源的模型剪枝库,yolov8是是一个2年前较为先进的目标检测模型。在torch-pruning库中有很多模型剪枝案例,本文以yolov8剪枝代码为案例进行分析,代码路径在torch-pruning项目下examples\yolov8\yolov8_pruning.py。本博文基于官方代码对coco128数据进行剪枝尝试,发现剪枝后的map有6个点的下降,这主要是coco128数据不够,同时官方的剪枝代码训练参数不够灵活。最终提出了修改意见,也对代码中关键部分进行分析。

2024-07-27 12:25:33 967 5

原创 模型剪枝中有哪些经验|mobile-yolov5-pruning-distillation项目中剪枝知识分析

mobile-yolov5-pruning-distillation是一个以yolov5改进为主的开源项目,主要包含3中改进方向:更改backbone、模型剪枝、知识蒸馏。这里主要研究其模型剪枝部分,关于知识蒸馏后续在进行分析。关于更改非coco训出的backbone(使用moblienet替换),可以发现存在相助的精度下降,这表明imagenet域训练处的权重迁移到目标检测领域不如二次迁移的模型(先imagenet,再coco训练)。从项目代码分析中,主要学习到bn层的稀疏化训练是如何实现的(章节2.1

2024-07-26 06:15:00 1176 1

原创 论文快过(图像配准|Coarse_LoFTR_TRT)|适用于移动端的LoFTR算法的改进分析 1060显卡上45fps

项目地址:https://github.com/Kolkir/Coarse_LoFTR_TRT创建时间:2022年相关训练数据:BlendedMVSLoFTR [19]是一种有效的深度学习方法,可以在图像对上寻找合适的局部特征匹配。本文报道了该方法在低计算性能和有限内存条件下的设备上的优化工作。原来的LoFTR方法是基于一个ResNet [6]backbone和两个基于线性transformer[22]架构的模块。

2024-07-25 06:49:15 1189

原创 模型剪枝中有哪些经验 | yolov5prune项目中模型剪枝经验分析

项目地址:https://github.com/midasklr/yolov5prune项目时间:2022年1月yolov5prune项目虽然是一个2年前的项目,但其是一个比较良好的剪枝案例。从中可以学习到模型剪枝相关的必要知识,为此对其信息及相关代码进行总结性分析,若要使用该项目则需要自行阅读项目md文档。根据项目分析,得出以下经验信息:1、进行稀疏化训练后,模型精度会有所下降,但稀疏化训练后剪枝模型(withou finetrun)精度下降不大,再次finetrun后精度会恢复;

2024-07-22 03:15:00 1101

原创 pytorch 46 将ASpanFormer模型导出onnx运行

ASpanFormer是一个2022年8月份发布的算法,其主要步骤与LoFTR模型类似,因此无法导出为onnx模型。根据ASpanFormer论文中的数据与效果图,可以确定AsPanFormer是可以作为一个比SP+SG更为有效的方案,其在标准数据集上的效果优于SP+SG,在速度上远超SP+SG,与LoFTR接近;在预测点的数量上远超SP+SG、LoFTR方案。通过修改代码后,可以将ASpanFormer模型导出为onnx运行,但在速度与效果上远不如torch模型。

2024-07-21 22:00:53 180

原创 项目快过(图像配准 | AsPanFormer) Detector-Free Image Matching with Adaptive Span Transformer

论文地址:https://arxiv.org/abs/2208.14201项目地址:https://github.com/apple/ml-aspanformercsdn论文简读:https://blog.csdn.net/qq_34426949/article/details/133861450在图像之间生成鲁棒和可靠的对应关系是各种应用程序的基本任务。为了在全局和局部粒度上捕获上下文,我们提出了一种基于探测器的匹配器,它基于变换器,采用了一种新的注意操作,能够以自适应的方式调整注意广度。

2024-07-21 14:40:49 972

原创 基于torch-pruning库对resnet18在cifar100数据集上进行剪枝实验

torch-pruning库是一个基于torch的剪枝库,其使用可以参考https://hpg123.blog.csdn.net/article/details/140421837。在此之外,该项目本身也提供了一些基础代码。本博文主要以benchmarks目录下的main.py代码为运行对象。对比了全局剪枝、局部剪枝、稀疏化训练的效果,训练目的是模型加速3倍。首先进行fineturn,训练的resnet18在cifar100的精度为0.7788,在全局剪枝下,group_norm、l1、l2、lamp、ra

2024-07-20 22:39:30 1108 2

原创 Torch-Pruning 库入门级使用介绍

项目地址:https://github.com/VainF/Torch-PruningTorch-Pruning 是一个专用于torch的模型剪枝库,其基于DepGraph 技术分析出模型layer中的依赖关系。DepGraph 与现有的修剪方法(如 Magnitude Pruning 或 Taylor Pruning)相结合可以达到良好的剪枝效果。本博文结合项目官网案例,对信息进行结构话,抽离出剪枝技术说明、剪枝模型保存与加载、剪枝技术的基本使用,剪枝技术的具体使用案例。

2024-07-15 02:15:00 1366

原创 项目快过( Self-Calibrated Illumination)Toward Fast, Flexible, and Robust Low-Light Image Enhancement

现有的`低光图像增强技术`大多不仅难以处理视觉质量和计算效率,而且在未知的复杂场景中也通常无效。在本文中,我们开发了一个新的自校准照明(SCI)学习框架,用于在现实世界的弱光场景中快速、灵活和鲁棒的亮化图像。具体来说,我们建立了一个具有权重共享的级联照明学习过程来处理这个任务。考虑到级联模式的计算负担,我们构建了自校准模块,实现了各阶段结果之间的收敛,产生了仅使用单一基本块进行推理的增益(在以前的工作中尚未利用),大大降低了计算成本。然后,我们定义了无监督的训练损失,以提高模型的能力,可以适应一般的场景。进

2024-07-14 17:16:29 869

原创 BasicSR项目(通用图像超分、修复、增强工具库)介绍

项目地址:https://github.com/XPixelGroup/BasicSR文档地址:https://github.com/XPixelGroup/BasicSR-docs/releasesBasicSR 是一个开源项目,旨在提供一个方便易用的图像、视频的超分、复原、增强的工具箱。BasicSR 代码库从2018年4月20日开始第一个提交,然后随着做研究、打比赛、发论文,逐渐发展与完善起来。它从最开始的针对超分辨率算法到后来拓展到其他更多复原增强相关的算法,

2024-07-14 13:39:39 928

原创 模型剪枝中的预训练权重真的有用么?重新思考模型剪枝的价值二

根据RETHINKING THE VALUE OF NETWORK PRUNING论文提供的数据初步整理出了模型剪枝的信息,但不够精练,故而在此深入分析。主要解决以下问题:1、模型剪枝真的有用么? 2、什么样的方案模型剪枝效果好?3、模型剪枝对性能影响大么?通过分析,得出结论,剪枝是有用的;自动结构化剪枝效果是综合效果最优的;对于任意规模的问题训练处的模型,剪枝50%基本上不会影响精度。

2024-07-13 23:23:34 723

原创 基于LoFTR_TRT项目实现LoFTR模型的trt推理与onnx推理,3060显卡下320图像30ms一组图

本博文主要记录了使用LoFTR_TRT项目将LoFTR模型导出为onnx模型,然后将onnx模型转化为trt模型。并分析了LoFTR_TRT与LoFTR的基本代码差异,但从最后图片效果来看是与官网demo基本一致的,具体可以。最后记录了onnx模型的使用【特征点提取、图像重叠区提取】,同时记录了在3060显卡,cuda12.1+ort17.1,输入尺寸为320x320的环境下,30ms一组图。

2024-07-07 15:11:01 895

原创 使用LoFTR模型进行图像配准、重叠区提取

LoFTR模型源自2021年CVPR提出的一篇论文,其基于pytorch实现图像配准,与基于superpoint+superglue的方法不同,是一个端到端的图像配准方法。与LoFTR官方库相关的有loftr2onnx库,整体来说loftr2onnx库使用更方便,效果更好。但loftr2onnx转出的onnx模型是有问题的,不能使用。

2024-07-06 22:54:59 1107

原创 论文阅读:RAM++ | Open-Set Image Tagging with Multi-Grained Text Supervision

发表时间:2023年11月16论文地址:https://arxiv.org/pdf/2310.15200项目地址:https://github.com/xinyu1205/recognize-anythingRecognize Anything Plus Model(RAM++),这是一种有效利用多粒度文本监督的开放集图像标记模型。以前的方法(例如,CLIP)主要利用与图像配对的全局文本监督,导致在识别多个单独的语义标签方面的次优性能。相比之下,RAM++无缝地集成了单个标签监督(tag。

2024-06-16 22:06:07 1007

原创 将AIRNet集成到yolov8中,实现端到端训练与推理

AIRNet是一个图像修复网络,支持对图像进行去雾、去雨、去噪声的修复。其基于对比的退化编码器(CBDE),将各种退化类型统一到同一嵌入空间;然后,基于退化引导恢复网络(DGRN)将嵌入空间修复为目标图像。可以将AIRNet的输出与yolov8进行端到端集成,实现部署上的简化。 本博文的实现,支持AIRNet模型在yolov8中的推理与训练,但是对于AIRNet模型的loss,不支持在训练输出中显示(改动量较大,故放弃了),但在每一次iter迭代中,各位可以添加loss信息存储代码,在训练结束后自行将ite

2024-06-10 18:36:52 393 5

原创 论文阅读:Indoor Scene Layout Estimation from a Single Image

这是一篇比较早的论文,偶然发现。其亮点有二:1、将室内布局估计任务转换为语义分割任务,使用像素交叉熵+平滑边缘loss进行训练。2、构建布局退化模式,见2.3,实现了数据增强过程中的布局属性的变化. 该论文已经是6年前的,后续在该领域当有更优质的算法。实在不行,换个模型也有巨大的效果提升。该论文主要是带来启发:1、语义分割模型还能这样子使用,作用于室内布局估计;2、任务转换的启发,将室内布局任务转换为语义分割,那室内布局任务也可以转换为关键点检测等任务;3、特定任务场景下的数据增强模式存在label的退

2024-06-10 09:48:21 1416 1

原创 AIRNet模型使用与代码分析(All-In-One Image Restoration Network)

本博客对AIRNet的关键结构实现,loss实现,data_patch实现进行深入分析,并对模型进行推理使用。AIRNet提出了一种较为简易的pipeline,以单一网络结构应对多种任务需求(不同类型,不同程度)。但在效果上看,ALL-In-One是不如One-By-One的,且本文方法的亮点是batch内选择patch进行对比学习。在与sota对比上,仅是Denoise任务精度占优,在Derain与Dehaze任务上,效果不如One-By-One的MPRNet方法。

2024-06-09 21:12:11 1864 4

原创 论文阅读:All-In-One Image Restoration for Unknown Corruption

从论文方法上看,AIRNet提出了一种较为简易的pipeline,以单一网络结构应对多种任务需求(不同类型,不同程度)。但在效果上看,ALL-In-One是不如One-By-One的,且本文方法的亮点是batch内选择patch进行对比学习。在与sota对比上,仅是Denoise任务精度占优,在Derain与Dehaze任务上,效果不如One-By-One的MPRNet方法。虽然精度不足,但方向是对了,在2024年,该方向或许有更优秀的论文

2024-06-09 15:04:33 1236

原创 图像超分辨率重建相关概念、评价指标、数据集、模型

超分辨率(Super-Resolution),简称超分(SR)。是指利用光学及其相关光学知识,根据已知图像信息恢复图像细节和其他数据信息的过程,简单来说就是增大图像的分辨率,使图像更加“清晰”,尽可能保证图像质量不下降。超分辨率的方法包括传统方法和深度学习的方法,有关超分辨率方法分类如下图所示。深度学习方法在性能上远远领先于传统方法,有着更好的图像超分辨率表现。知乎用户 阿布的足迹​ https://zhuanlan.zhihu.com/p/558813267从单一低分辨率图像中恢复高分辨率图像。

2024-05-20 00:52:19 3765 2

原创 将gdip-yolo集成到yolov9模型项目中(支持预训练的yolov9模型)

YOLOv9意味着实时目标检测的重大进步,引入了可编程梯度信息(PGI)和通用高效层聚合网络(GELAN)等开创性技术。该模型在效率、准确性和适应性方面取得了显著改进,在MS COCO数据集上建立了新的基准。YOLOv9项目由一个独立的开源团队开发,建立在Ultralytics YOLOv5提供的强大代码库的基础上,展示了人工智能研究社区的合作精神。yolov9模型在coco数据集的效果如下所示。

2024-04-18 21:43:09 382

原创 将gidp模块、ipam集成到ultralytics项目中实现支持预训练权重的gidp-yolov8、ipam-yolov8

gdip-yolo与ia-seg都是一种将图像自适应模块插入模型前面,从而提升模型在特定数据下检测能力的网络结构。gdip-yolo提出了gdip模块,可以应用到大雾数据与低亮度数据(夜晚环境),然后用于目标检测训练;ia-seg将ia-yolo中的代码修改了一下修车了ipam模块,应用到低亮度数据(夜晚环境),然后用于语义分割训练。我们可以抽取gdip模块与ipam模块,完全嵌入到ultralytics项目中,以支持ultralytics项目中的任意模型,目前已经验证支持yolov8n-gdip.yaml

2024-04-17 22:51:23 512 4

原创 模型剪枝中的预训练权重真的有用么?重新思考模型剪枝的价值

过度参数化是深度神经网络中一个被广泛存在的情况,这导致了高计算成本和高推理内存占用。在低资源环境下,网络剪枝被广泛用于降低深度模型的推理成本。典型的网络剪枝过程包括三个阶段: 1)训练一个大型的、过参数化的模型(有时有预训练后的模型),2)根据一定的标准对训练后的大型模型进行剪枝,3)对剪枝后的模型进行微调,以恢复失去的性能。网络剪枝方法的一个主要分支是个体权重剪枝(非结构化剪枝),该方法基于权重对结果的贡献进行剪枝(如L1、L2范数等)。然而,这些。

2024-04-14 10:57:48 1140

原创 pytorch 45 使用自己的数据对groundingdino进行微调

Grounding DINO是一种基于transformer的视觉语言检测方法,它可以根据文字描述检测指定目标。它是在DINO的基础上,增加了多个阶段的视觉语言模态融合,包括特征增强器、语言指导的查询选择模块和跨模态解码器。它可以实现最先进的对象检测器的性能,消除了对NMS等手工模块的依赖。然而在应用到业务数据上还是有所不足,故而需要对Grounding DINO进行微调。本博文基于Grounding-Dino-FineTuning项目实现对自己yolo数据的微调

2024-04-12 21:16:57 825 2

原创 使用自己训练的superpoint与superglue模型进行图像配准

基于官方团队发布的预训练模型,使用SuperPoint与SuperGlue实现图像配准,可以参考基于官方团队发布的代码训练自己的模型,可以参考进行实现,训练出的模型不能直接参考上述博客进行部署,为此发布使用代码。本博文实现基于进行改进。

2024-04-04 20:50:22 2476 5

原创 提取gdip-yolo与ia-seg中的图像自适应模块进行图像去雾与亮度增强

gdip-yolo与ia-seg都是一种将图像自适应模块插入模型前面,从而提升模型在特定数据下检测能力的网络结构。gdip-yolo提出了gdip模块,可以应用到大雾数据与低亮度数据(夜晚环境),然后用于目标检测训练;ia-seg将ia-yolo中的代码修改了一下修车了ipam模块,应用到低亮度数据(夜晚环境),然后用于语义分割训练。这两个项目都发布了预训练模型,我们可以抽取预训练模型中的图像自适应模块进行数据增强。

2024-03-29 22:41:47 298

原创 LangSAM项目优化,将SAM修改为MoblieSAM,提速5~10倍

Language Segment-Anything 是一个开源项目,它结合了实例分割和文本提示的强大功能,为图像中的特定对象生成蒙版。它建立在最近发布的 Meta 模型、segment-anything 和 GroundingDINO 检测模型之上,是一款易于使用且有效的对象检测和图像分割工具。然而在整个流程中,GroundingDINO 通常耗时0.6s作用,segment-anything 通常耗时5-8s左右。

2024-03-28 22:14:36 723

原创 python工具方法 48 基于视觉大模型生成目标检测数据集

核心代码如下所示,只是将text_prompt 赋值为"street lamp",将png_path中的特征名称改成"_street lamp_ng.png"生成的mask效果如下所示,billboards(广告牌)生成的mask与signs(标签)生成的mask基本相近,这是由于二者在形态特征上过度相似所导致的。核心代码如下所示,只是将text_prompt 赋值为"billboards",将png_path中的特征名称改成"_billboards_ng.png"

2024-03-27 22:07:15 180

原创 基于yolo-world与mobile_sam实现类似lang-segment-anything

lang-segment-anything基于segment-anything 和 GroundingDINO 实现基于语言分割出任意对象,但是segment-anything 模型与GroundingDINO 都是运算量比较大的模型。

2024-03-24 09:17:46 917

原创 lang-segment-anything使用介绍

Language Segment-Anything 是一个开源项目,它结合了实例分割和文本提示的强大功能,为图像中的特定对象生成蒙版。它建立在最近发布的 Meta 模型、segment-anything 和 GroundingDINO 检测模型之上,是一款易于使用且有效的对象检测和图像分割工具。基于GroundingDINO 实现Zero-shot text-to-bbox方法。使用 Lightning AI 应用程序平台轻松部署。可自定义的文本提示,用于精确的对象分割。

2024-03-19 21:35:34 1989 4

原创 将FastSAM中的TextPrompt迁移到MobileSAM中

SAM提到了text prompt,但其代码中没有发布实现方式,MobileSAM也没有实现text prompt,而FastSAM以一种巧妙的方式实现了text prompt。这主要因为,在现有成熟的训练体系下加入Prompt机制是比较复杂的,MobileSAM基于解耦蒸馏绕过Prompt的训练(`使用sam原始的prompt的`),而FastSAM将Prompt看作一种结果稀疏化的方法(`对于位置类prompt,采用逻辑操作进行mask选择;对于text的prompt,基于clip对实例切片进行余弦

2024-03-17 15:12:48 390

原创 如何实现sam(Segment Anything Model)|fastsam模型

通过本博文的查阅与分析,实现fastsam是较为简便的,且fastsam的性能可以随着全景实例分割模型的发展而进一步提升,同时也说明了fastsam中prompt的实现。而在sam中,各种实现较为生涩难懂,主要说明sam的模型结构,基本原理,数据生成范式。sam的亮点在于基于少量的语义分割标签,迭代出了一个1.1B 标签超大型数据集,其不断扩展标注数据量的思想是值得学习的;而在fastsam中则是对SAT重新定义得出SAT,基于对全景实例分割模型的后处理实现了类似sam的性能。

2024-03-13 22:48:16 2251

原创 python工具方法 47 基于paddleseg将目标检测数据升级为语义分割数据

在进行项目研究时,通常需要搜集开源数据集。但是所能搜集到的数据集通常会存在形式上的差异,比如我想要的是语义分割数据,而搜集到的数据集却是目标检测数据;在这种情况下所搜集的数据就完成没有利用价值了么?不,其还存在价值,我们可以通过模型训练对数据标签的标注粒度进行优化。本博文基于paddleseg实现将烟火目标检测数据优化为烟火分割数据。具体效果如下所示:原始的目标检测数据变成了标注更为精准的语义分割数据。关于数据迭代中,在那一轮终止,又或者如果决断伪标签与原始真标签的差异并没有深入(

2024-03-10 20:53:36 275

原创 将gdip-yolo集成到yolov8项目中(核心思路可以应用到yolov9的集成)

本博文通过gdip-yolo论文的深入分析发现,其论文中最为关键的gdip-yolo与gdip-regularizer,为此先在yolov8项目中实现gdip-yolov8,后续时间会考虑将gdip-regularizer集成对最新的目标检测算法。发现gdip-yolov8模型无法导出为onnx模型,这是因为gdip-yolo模块中使用了vgg16作为视觉编码器,然后vgg16中包含了adaptive_avg_pool2d无法被onnx算子所支持(需要自己固定图像输入尺寸,然后修改为avg_pool2d)

2024-03-06 22:28:46 510 7

原创 python工具方法 46 随机生成mask图像用于变化检测训练与图像修复训练

在进行变化检测训练中通常需要数据对进行标注,这是一件成本比较高的工作;同时,在进行图像修复训练中也需要随机生成mask。为此整理代码随机生成mask和变化图像。

2024-02-22 14:49:26 235

原创 使用AOT-GAN-for-Inpainting训练自己的数据集

AOT-GAN-for-Inpainting是一个开源的图像修复项目,其对 Places2 数据集的效果表明,该模型在 FID 方面明显优于最先进的模型,相对改进了 1.8%。一项包括 365 多名受试者的用户研究进一步验证了 AOT-GAN 的优越性。其开源的模型在logo去除、面部修复和物体移除上取得良好效果。我们可以使用 AOT-GAN-for-Inpainting项目训练自己的数据集。AOT-GAN-for-Inpainting的解读可以参考。

2024-02-22 14:09:52 496

win10下用vs2019编译好的curl 64位库 版本7.84.0

在win10用cmake3.22与vs2019编译好的curl库,版本号为7.84.0(当下最新版,支持SLL)。库文件已经整理成了lib、include的结构,其中还内置curl.exe. curl是一个利用URL语法在命令行下工作的文件传输工具,支持很多种http请求操作,详情可以参考Linux curl命令最全详解_Angel_CG的博客-CSDN博客_curl命令。curl现在在linux与win10都是有内置的,在命令行中可以直接使用curl指令。

2022-06-28

python释放cuda缓存库

博主自行实现的动态链接库,通过python导入后可以实现释放显存,与ai框架无关。支持pytorch、tensorflow、onnxruntime等cuda运行环境。调用dll.reset_cuda()即可释放显存

2022-06-21

windows下GDAL322的库

从GDAL322安装包中抽取出的库,避免了的安装和下载多个包的过程。包含lib、bin、include三个目录。将lib的路径添加到系统环境变量中就算是配置好了GDAL322。

2022-06-10

基于paddle2实现对paddlehub中的静态图的训练

基于paddle2实现了对paddlehub2中的静态图的训练,可以使用paddle.vision.transforms实现训练模型时的数据增强。避免了paddlehub1.x下无法在训练过程中增强数据的缺陷。基于此,还可以实现对paddlehub内置模型的知识蒸馏。如果想免费试用,请浏览https://blog.csdn.net/a486259/article/details/123191622,复制代码保存为文件即可。

2022-02-28

paddle.hub迁移学习-图像分类案例

基于paddle2.0内置的hub库所实现的迁移学习代码,包含4个文件,分别涉及模型、数据、训练和测试。该代码具体的使用方式请参考https://blog.csdn.net/a486259/article/details/123140942

2022-02-25

opencv4.5.3+opencv-contrib+CUDA

参考知乎教程https://zhuanlan.zhihu.com/p/354838274所实现的opencv4.5.3+opencv_contrib+CUDA11.1,在win10下用vs2019编译,显卡为3060,CUDA_ARCH_BIN设置为7.0;7.5;8.0;8.6。

2022-02-18

flowers数据集.rar

处理好的flowers17数据集,包含训练集、验证集和测试集,和相应的数据集分类代码。

2021-11-27

RDPWrap-v1.6.2.zip

用于开启win10家庭版的远程桌面,其中包含各个版本的ini文件

2021-07-22

目标检测 数据扩充增强工具

用于目标检测的数据增强工具,通过读取voc格式的数据可以对图像和相应的box进行缩放、平移、镜像、旋转、resize和更改颜色空间。通过对扩充方法的随机组合,可以将一个带标注的图像扩充成100幅。资源使用方面有问题请查看https://blog.csdn.net/a486259/article/details/121644786

2021-06-15

labelme-4.5.7.exe

已打包好的最新版labelme-4.5.7,可以单独运行无需配置python环境。可以绘制多边形、圆形、线与点。因为不会压缩,所以文件大小有270m

2021-03-25

图像批处理方法-图像空白裁剪、灰度化、缩放

按照目录对图像进行灰度化、缩放(比例默认为1/3)、空白处裁剪(裁剪掉图片多余的空白) =图像周边空白裁剪:按行和列统计图像四周的空白率,空白率过高的行和列将被裁剪掉(方法中设置为0.8,以灰度值大于0,9表示空白像素,可以按需更改)

2020-10-04

python工具方法 HristoryAvery

python工具方法 HristoryAvery方法在时序预测上的实现与使用,包含fit、predict、split_data三个方法。split_data用于划分数据集

2020-10-04

keras库文件,在loss和metrics库文件中添加rmse方法

在keras的loss库中添加rmse方法,成功使模型能正常使用rmse方法。在metrics.py文件上添加rmse方法后可以使用model.compile(loss='mse',weighted_metrics=['rmse'])方法,可以在其他loss的条件下观测rmse的变化

2020-08-20

Wood Species Dataset-all.zip

Wood Species Dataset数据集有12种木材8千多个图像组成,其中有三种软木树种和九种阔叶树种,图像分为3类,分别是每种木材的横切面图片、弦切面图片和径切面图片。使用数据集时请务必按数据作者要求引用文献

2020-07-15

ILSpy反编译与ConfuserEx混淆工具.zip

通用的代码混淆工具ConfuserEx和代码反编译工具ILSpy,适用于windows桌面exe软件。

2020-05-29

手写数字字母数据集[0-9,a-z,A-Z]

预处理过的EnglishHnd手写数字字母数据集,文件名已经改成数字、字母(限于windows10下不区分大小写,大写字母的都是双字母,如AA,BB),尺寸被裁剪缩放到28*28,与minist数据集完美兼容。

2019-04-10

minist手写数字数据集(含代码)

minist手写数字数据集(含代码,案例有softmax分类、knn分类和神经网络分类),代码简洁易懂,可以当做练手资料

2018-11-28

cryptoJs加密解密工具

cryptoJs加密解密工具,并集成EncryptAes、DecryptAes两个方法,require(util.js)即可用。参数以json方式传递

2018-07-20

自己训练的superpoint与superglue模型

使用自己训练的superpoint与superglue模型进行图像配准(https://hpg123.blog.csdn.net/article/details/137381647) 博客中对应的模型与图片。放置对SuperGluePretrainedNetwork目录下,替换掉对应的文件即可使用

2024-04-12

使用FastDeploy 进行(图像分类、目标检测、语义分割、文本检测-orc)python部署

本资源整理了(图像分类、目标检测、语义分割、文本检测|orc)的FastDeploy-python部署案例,里面包含模型与对应的数据,下载资源后,安装FastDeploy即可使用。 FastDeploy是一款全场景、易用灵活、极致高效的AI推理部署工具, 支持云边端部署。提供超过 160+ Text,Vision, Speech和跨模态模型开箱即用的部署体验,并实现端到端的推理性能优化。包括 物体检测、字符识别(OCR)、人脸、人像扣图、多目标跟踪系统、NLP、Stable Diffusion文图生成、TTS 等几十种任务场景,满足开发者多场景、多硬件、多平台的产业部署需求。

2024-01-25

AOT-GAN-for-Inpainting项目中pt模型转化的onnx模型

AOT-GAN-for-Inpainting是一个开源的图像修复项目,其对 Places2 数据集的效果表明,我们的模型在 FID 方面明显优于最先进的模型,相对改进了 1.8%。一项包括 365 多名受试者的用户研究进一步验证了 AOT-GAN 的优越性。我们进一步评估了所提出的AOT-GAN在实际应用中的应用,例如,logo去除、面部修复和物体移除。结果表明,我们的模型在现实的广泛数据数据中取得了良好的效果。在论文中表述了一共在3个数据集上进行训练,但仅发布了两个预训练模型,关于logo移除的模型或许设计商业因素未公开。 本资源包含 CELEBA-HQ 与 Places2 两个数据集的onnx模型 https://hpg123.blog.csdn.net/article/details/135561206

2024-01-13

paddle-infer模型(包含ppyoloe-m、resnet50、segformerb1)

paddle_infer模型(包含ppyoloe_m_plus、resnet50、segformerb1的预训练模型),属于https://hpg123.blog.csdn.net/article/details/135229800中的模型、数据部分。含imagenet1000.txt类别信息,object365.txt类别信息

2023-12-26

win10上cuda12.1+tensorrt8.6+vs2019环境下编译onnxruntime1.17

onnxruntime官方在cuda12出来一年后都没有发布支持cuda12的onnxruntime版本,故此博主在win10上cuda12.1+tensorrt8.6+vs2019+py38环境下自行编译onnxruntime-gpu 1.17版本。本资源包,有onnxruntime_gpu-1.17.0-cp38-cp38-win_amd64.whl文件可以用于python的安装使用,还包含include、lib、bin文件支持c++编程使用。

2023-12-25

使用ROPNet项目在modelnet40数据集上训练的模型

具体包括:min_loss.pth、min_rot_error.pth两个模型文件https://github.com/zhulf0804/ROPNet项目提供了一个配准效果良好的点云模型,但是并没有发布预训练模型。故此,博主基于项目作者公布的代码,使用默认参数进行训练,约训练了450个epoch(完整epoch为600个)。所得到的模型精度与论文有轻微差异,但仍然能保证领先的精度。 训练loss: Loss: 0.1087, Error R: 2.2862, Error t: 0.0218, anisotropic R(mse, mae): 2.6079, 1.1766, anisotropic t(mse, mae): 0.0224, 0.0103 测试效果: Error R error: 1.6421 Error t error: 0.0171 anisotropic mse R error: 1.9071 anisotropic mae R error: 0.8711 anisotropic mse t error : 0.0177 anisotropic mae t err

2023-12-03

16位tif影像转jpg软件(win10可用,无任何依赖)

16位tif影像转jpg软件(win10可用,无任何依赖),对于16位tif影像转jpg,实现了3种转换函数,分别为normalization_img、min_max_normalization_img、cut_normalization_img。其中cut_normalization_img函数可以滤除掉tiff影像中的异常值,可以在格式转换时增强图像效果的稳定性。 软件由exe文件和ui文件组成,可以按照个人需求修改ui界面设计,修改后保存即可生效,无需更新软件。 同时也支持对jpg、png、bmp图像进行上述操作。 支持将图片拖入软件界面,也支持通过按钮选择图片。 软件具体实现介绍可以参考:https://hpg123.blog.csdn.net/article/details/131603554

2023-07-07

基于pyqt5所实现的16U tiff影像转8U影像软件源码

现在大部分图像软件都支持tiff影像的浏览,但都是仅限于8位的影像,对应CV16U类型的tiff影像并不支持(这需要专业的gis软件才可进行操作)。为了便捷操作,故此基于pyqt5+opencv实现16位tif影像转jpg的软件。由于博主还是不太喜欢将ui文件转换为py文件再去构建界面,直接加载ui文件构建界面可以节省一个中间步骤,且这可以在软件发布后直接修改ui文件达到快速更新软件的效果。 将16U的数据转换为8U有两种最简单的方式,即为归一化,具体如normalization_img函数代码所示,先将数据的值域压缩到0 ~ 1,然后再调整到 0 ~ 255。这种转换可能会存在某种问题,例如数据的整体值偏高,这样转化后就看不到差异了,故此又设计了min_max_normalization_img函数。先将数据的最小值调整为0,然后再进行归一化。 对于某些特殊的行业数据,可能存在较多的噪声,其最大值和最小值并不能真实反映数据的情况(可能为传感器故障),从而需要对数据值域的频率进行统计,找到噪声的阈值(最大值阈值、最小值阈值),将大于最大值阈值的数值修改为最大值阈值,将小于最小值阈值

2023-07-07

pyqt5的基本使用demo

对应的代码讲解在:https://hpg123.blog.csdn.net/article/details/131564563?spm=1001.2014.3001.5502,博文记录了pyqt5使用记录涉及pyqt界面控件的基本介绍,使用designer设计界面ui,并将其转化为py代码。关于界面主要实现radioButton的互斥选中事件、comboBox的选中事件(依据list添加item)、pushButton的单击事件、槽函数自动绑定、图片的拖入显示。 代码下载后,安装好qt环境既可使用,包含原始的ui文件,可以按照个人需求修改代码实现。

2023-07-06

ARM架构下ubuntu18.04编译好的opencv3.4.15(开箱即用)

ARM架构下ubuntu18.04编译好的opencv3.4.15(python版为通过编译),内置CMakeLists.txt模板文件,可以通过cmake的 find_package(OpenCV REQUIRED)直接配置opencv库。 编译时的系统信息如下: root@HelperBox:~# uname -a Linux HelperBox1.t507 4.9.170 #42 SMP PREEMPT Sat Nov 5 18:40:25 CST 2022 aarch64 aarch64 aarch64 GNU/Linux root@HelperBox:~# lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 18.04.4 LTS Release: 18.04 Codename: bionic

2023-07-02

基于c++实现的文件加密解密代码

基于c++实现的文件加密解密代码,支持将二进制文件读取为char数组,然后根据自定义code对数据进行局部取反操作、局部倒序操作、局部滑动操作。 取反操作:将数据进行取反;解密操作也是取反操作;以单个char为操作单元 倒序操作:将数组的顺序进行翻转;解密操作也是倒序操作;以char数组为操作单元 滑动操作:将数组首位相连,进行一定的转动;解密操作也是滑动操作;以char数组为操作单元; 以头文件的方式实现,除标准std库外,不依赖任何第三方库;include到个人项目中即可使用。

2023-04-08

C++下web框架corw的完全使用手册(实现中文支持)

corw是一个开源、轻量化的c++web库,在使用上与python的flask是类似的。本文档为corw的完整使用文档,含项目配置(基于cmakelist)、路由绑定、返回数据(json、文本、response对象、静态资源、模板文件)、接口请求处理(REST请求,url参数绑定、json请求、GET参数和POST参数)和各种高级操作(Cookie操作、Session操作、文件上传操作、文件下载操作、websocket操作、自定义loghandler)。此外,还对各类参数请求、结果返回过程中对中文的支持(如get参数、post参数、url参数、json结果中中文参数的正确解读)

2023-02-20

2023-02-14

win10下vs2019编译的opencv470+opencv-contrib(python pyd文件、c++包和编译缓存)

win10下vs2019编译的opencv470+opencv_contrib,包含opencv python版本的pyd文件和自行编译opencv470的.cache文件,各位可以下载.cache文件自己编译opencv470。所编译的opencv470中的lib和dll不是一个单独的文件,博主使用lib.exe将所有的lib文件合并为了opencv_world470.lib(链接器附加依赖性只需要opencv_world470.lib一个即可),但是dll文件没有合并(dll文件路径添加到环境变量path中即可)

2022-12-31

基于vs2019实现的绘图软件(矩形、多边形绘制)

实现了画笔(可以设置大小和颜色)、橡皮擦(可以设置大小),实现了绘制矩形(可以设置填充和不填充、可以设置颜色)、绘制多边形(可以设置填充和不填充、可以设置颜色)等基本功能。此外,还实现了导入底图的功能。

2022-10-18

60个labelme标注的船只数据

用于做格式转换的demo数据,可以支持目标检测模型的训练与测试

2022-10-10

基于c#实现的webapi调用软件

基于c#实现的webapi调用软件,用于请求web服务,尤其是通过aistudio平台部署的深度学习模型。如果您的自己的webapi接口返回的也是json格式的信息,也可以使用本软件进行请求调用。只是在请求服务前,一定要点击软件界面加密,将原始的url信息转化为用户不可读的字符串,然后再点击测试

2022-09-01

EditThisCookie.crx cookie编辑导入导出利器

支持多种导出格式,其导出的cookie支持在curl中使用(导出格式选择Netscape HTTP Cookie File)。

2022-06-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除