图像处理
文章平均质量分 88
justld
努力努力再努力
展开
-
使用阿里云试用资源快速部署web应用-dofaker为例
本文介绍使用阿里云的试用资源部署dofaker的方法,本教程主要作学习在阿里云部署web应用之用,部署好应用之后,可以在任何地点通过公网ip访问web应用。原创 2024-10-02 08:37:41 · 840 阅读 · 0 评论 -
【深度学习实践】基于深度学习的图像去雾算法-ChaIR-实践
本文介绍一个去雾算法ChaIR的使用方法,可以完成图像去雾,也可以用于图像去雨、去噪音等任务。本文不涉及论文原理,只包含源代码的跑通和使用。原创 2024-08-12 18:36:57 · 1609 阅读 · 0 评论 -
【医疗图像分割】UNETR++论文笔记及代码跑通实践
在医疗图像分割任务中,transformer模型获得了巨大的成功,UNETR提出了efficient paired attention (EPA) 模块,利用了空间和通道注意力来有效地学习通道和空间的特征,该模型在Synapse,BTCV,ACDC,BRaTs数据集上都获得了很好地效果。原创 2024-07-29 12:51:53 · 989 阅读 · 9 评论 -
OrangePi AIpro测评体验-Yolov5目标检测模型
本文介绍了OrangePi AIpro的测评结果,跑通了官方给定的示例代码,并使用图片和视频对yolov5模型进行测试,总体感觉非常nice。原创 2024-05-22 19:38:11 · 1300 阅读 · 0 评论 -
【深度学习目标检测】二十六、基于深度学习的垃圾检测系统-含数据集、GUI和源码(python,yolov8)
设计垃圾检测系统的意义在于多个方面,这些方面不仅关乎环境保护和城市管理,还涉及到技术进步和社会效益。综上所述,设计垃圾检测系统具有重要意义,不仅有助于环境保护和资源回收,还能提高城市管理和卫生水平,推动技术创新和应用拓展,产生经济效益和社会效益。同时,系统还能够应对垃圾处理挑战并符合政策和法规的要求。本文介绍了基于yolov8的行人检测计数系统,包括训练过程和数据准备过程,同时提供了推理的代码和GUI。原创 2024-05-13 12:54:48 · 1190 阅读 · 1 评论 -
【nnUNetv2实践】二、nnUNetv2快速入门-训练验证推理集成一条龙教程
nnUNet是一个自适应的深度学习框架,专为医学图像分割任务设计。以下是关于nnUNet的详细解释和特点:自适应框架:nnUNet能够根据具体的医学图像分割任务自动调整模型结构、训练参数等,从而避免了繁琐的手工调参过程。自动化流程:nnUNet包含了从数据预处理到模型训练、验证及测试的全流程自动化工具,大大简化了使用深度学习进行医学图像分割的复杂度。自适应网络结构调整:根据输入数据集的特点,nnUNet能够自动选择和配置合适的网络深度、宽度等超参数,确保模型在复杂性和性能之间取得平衡。原创 2024-04-08 14:01:45 · 6898 阅读 · 58 评论 -
【深度学习目标检测】二十五、基于深度学习的花卉分类系统-含数据集、GUI和源码(python,yolov8)
设计花卉分类系统的原因主要有以下几点:组织和识别:分类系统有助于组织和识别大量的花卉品种。通过将花卉按照特定的标准进行分类,可以更容易地找到、识别和区分不同的花卉。科学研究:分类系统为科学家提供了研究花卉的基础框架。通过对花卉进行分类,科学家可以更好地理解花卉之间的亲缘关系、进化历程和生物多样性,从而推动植物学和相关领域的研究进展。园艺和农业应用:对于园艺师和农民来说,花卉分类系统有助于选择适合特定环境和用途的花卉品种。通过了解花卉的分类信息,他们可以更有针对性地选择种植、繁殖和推广特定的花卉。原创 2024-03-29 13:37:59 · 1289 阅读 · 0 评论 -
【深度学习目标检测】二十四、基于深度学习的疲劳驾驶检测系统-含数据集、GUI和源码(python,yolov8)
疲劳驾驶是引发交通事故的重要因素之一。驾驶员在长时间驾驶或缺乏休息的情况下,反应速度和判断能力会显著下降,从而增加事故风险。通过实时检测驾驶员的疲劳状态,并及时发出警告或采取相应措施,疲劳驾驶检测系统可以显著提高道路安全性,减少因疲劳驾驶引发的事故。:长时间驾驶对驾驶员的身体健康也有不良影响,可能导致肌肉疲劳、眼睛疲劳、颈椎问题等。通过检测疲劳状态,系统可以提醒驾驶员适时休息,有助于保护驾驶员的身体健康。:疲劳驾驶不仅危险,还会导致驾驶效率下降。原创 2024-03-23 13:41:26 · 2778 阅读 · 2 评论 -
【深度学习目标检测】二十三、基于深度学习的行人检测计数系统-含数据集、GUI和源码(python,yolov8)
行人检测计数系统是一种重要的智能交通监控系统,它能够通过图像处理技术对行人进行实时检测、跟踪和计数,为城市交通规划、人流控制和安全管理提供重要数据支持。本系统基于先进的YOLOv8目标检测算法和PyQt5图形界面框架开发,具有高效、准确、易用等特点。系统特点本文介绍了基于yolov8的行人检测计数系统,包括训练过程和数据准备过程,同时提供了推理的代码和GUI。对准备相关的毕业设计的同学有着一定的帮助。原创 2024-03-13 10:34:01 · 2508 阅读 · 2 评论 -
深度学习目标检测】二十二、基于深度学习的肺炎检测系统-含数据集、GUI和源码(python,yolov8)
肺炎尽管很常见,但准确诊断是一项困难的任务。它要求训练有素的专家对胸部X光片进行检查,并通过临床病史,生命体征和实验室检查进行确认。肺炎通常表现为胸部X光片上一个或多个区域的阴影(opacity)增加。但是,由于肺部有许多其他状况,例如体液超负荷(肺水肿),出血,体液丢失(肺不张或塌陷),肺癌,放疗后或手术改变也会产生阴影(opacity),因此对胸部X光片肺炎进行诊断非常复杂。在肺外,胸膜腔积液(胸腔积液)也表现为胸部X光片的阴影(opacity)增加。原创 2024-03-03 12:19:29 · 1872 阅读 · 2 评论 -
【深度学习目标检测】二十一、基于深度学习的葡萄检测系统-含数据集、GUI和源码(python,yolov8)
葡萄检测在农业中具有多方面的意义,具体来说如下:首先,葡萄检测有助于保障农产品质量安全。通过对葡萄进行质量安全专项监测,可以确保葡萄中的农药残留、重金属等有害物质含量符合标准,从而保障消费者的健康。同时,葡萄检测还可以对葡萄的产量进行精准预测,有助于农业生产者制定科学的种植计划。其次,葡萄检测可以促进农业科技进步。随着计算机技术和精准农业的发展,图像技术已被广泛应用于葡萄检测中。这种技术可以代替人眼快速、准确地进行检测分析,有助于提高葡萄检测的效率和准确性。原创 2024-02-27 12:33:02 · 1664 阅读 · 4 评论 -
深度学习目标检测】二十、基于深度学习的雾天行人车辆检测系统-含数据集、GUI和源码(python,yolov8)
雾天车辆行人检测在多种场景中扮演着至关重要的角色。总的来说,雾天车辆行人检测技术在提升道路安全、辅助驾驶、提高交通效率以及推动自动驾驶技术的发展等方面都发挥着重要作用。本文介绍了基于深度学习yolov8的雾天行人车辆检测系统,包括训练过程和数据准备过程,同时提供了推理的代码和GUI。对准备相关的毕业设计的同学有着一定的帮助。原创 2024-02-26 14:07:26 · 3806 阅读 · 10 评论 -
【深度学习目标检测】十九、基于深度学习的芒果计数分割系统-含数据集、GUI和源码(python,yolov8)
使用深度学习算法检测芒果具有显著的优势和应用价值。综上所述,使用深度学习算法检测芒果可以提高检测效率、准确性和自动化水平,是芒果检测领域的一种重要技术手段。本文介绍了基于深度学习yolov8的芒果检测系统,包括训练过程和数据准备过程,同时提供了推理的代码和GUI。对准备相关的毕业设计的同学有着一定的帮助。原创 2024-02-24 09:56:15 · 1769 阅读 · 0 评论 -
【深度学习目标检测】十八、基于深度学习的人脸检测系统-含GUI和源码(python,yolov8)
人脸检测是计算机视觉中的一个重要方向,也是一个和人们生活息息相关的研究方向,因为人脸是人最重要的外貌特征。总之,人脸检测技术在许多领域都有广泛的应用前景,它能够提高人们生活的便利性、安全性和自动化程度。随着技术的不断进步,人脸检测将在更多领域发挥重要作用。本文介绍了基于深度学习yolov8的洋葱检测系统,包括训练过程和数据准备过程,同时提供了推理的代码和GUI。对准备计算机视觉相关的毕业设计的同学有着一定的帮助。原创 2024-02-23 09:19:54 · 1829 阅读 · 0 评论 -
【论文笔记】BiFormer: Vision Transformer with Bi-Level Routing Attention
vision transformer中Attention是极其重要的模块,但是它有着非常大的缺点:计算量太大。BiFormer提出了Bi-Level Routing Attention,在Attention计算时,只关注最重要的token,由此来降低计算量。原创 2023-12-26 13:49:16 · 1819 阅读 · 1 评论 -
【论文笔记】Run, Don’t Walk: Chasing Higher FLOPS for Faster Neural Networks
该论文主要提出了PConv,通过优化FLOPS提出了快速推理模型FasterNet。在设计神经网络结构的时候,大部分注意力都会放在降低FLOPs( floating-point opera-tions)上,有的时候FLOPs降低了,并不意味了推理速度加快了,这主要是因为没考虑到FLOPS(floating-point operations per second)。针对该问题,作者提出了PConv( partial convolution),通过提高FLOPS来加快推理速度。原创 2023-12-26 10:41:23 · 1171 阅读 · 3 评论 -
【深度学习目标检测】十二、基于深度学习的钢铁缺陷识别(python,目标检测,yolov8)
YOLOv8是一种物体检测算法,是YOLO系列算法的最新版本。YOLO(You Only Look Once)是一种实时物体检测算法,其优势在于快速且准确的检测结果。YOLOv8在之前的版本基础上进行了一系列改进和优化,提高了检测速度和准确性。YOLOv8采用了Darknet-53作为其基础网络架构。Darknet-53是一个53层的卷积神经网络,用于提取图像特征。与传统的卷积神经网络相比,Darknet-53具有更深的网络结构和更多的卷积层,可以更好地捕捉图像中的细节和语义信息。原创 2023-12-25 15:08:28 · 2865 阅读 · 4 评论 -
【深度学习目标检测】十一、基于深度学习的电网绝缘子缺陷识别(python,目标检测,yolov8)
YOLOv8是一种物体检测算法,是YOLO系列算法的最新版本。YOLO(You Only Look Once)是一种实时物体检测算法,其优势在于快速且准确的检测结果。YOLOv8在之前的版本基础上进行了一系列改进和优化,提高了检测速度和准确性。YOLOv8采用了Darknet-53作为其基础网络架构。Darknet-53是一个53层的卷积神经网络,用于提取图像特征。与传统的卷积神经网络相比,Darknet-53具有更深的网络结构和更多的卷积层,可以更好地捕捉图像中的细节和语义信息。原创 2023-12-25 14:35:17 · 2236 阅读 · 0 评论 -
【深度学习实践】换脸应用dofaker本地部署
本文介绍了dofaker换脸应用的本地部署教程,dofaker支持windows、linux、cpu/gpu推理,不依赖于任何深度学习框架,是一个非常好用的换脸工具。本教程的部署系统为windows 11,使用CPU推理。注意:1、请确保您的所有路径不要包含中文,否则可能发生奇怪的问题(windows用户名不要是中文)2、安装好,勾选C++开发。原创 2023-12-22 14:53:36 · 844 阅读 · 0 评论 -
【深度学习目标检测】十、基于yolov5的火灾烟雾识别(python,目标检测)
本文介绍了基于Yolov5的火焰烟雾检测模型,包括训练过程和数据准备过程,同时提供了推理的代码。对准备计算机视觉相关的毕业设计的同学有着一定的帮助。原创 2023-12-18 15:07:36 · 3188 阅读 · 0 评论 -
【深度学习目标检测】九、基于yolov5的路标识别(python,目标检测)
本文介绍了基于Yolov5的路标检测模型,包括训练过程和数据准备过程,同时提供了推理的代码。对准备计算机视觉相关的毕业设计的同学有着一定的帮助。原创 2023-12-18 13:26:48 · 1656 阅读 · 0 评论 -
【深度学习目标检测】九、基于yolov5的安全帽识别(python,目标检测)
本文介绍了基于Yolov5的安全帽检测模型,包括训练过程和数据准备过程,同时提供了推理的代码。对准备计算机视觉相关的毕业设计的同学有着一定的帮助。原创 2023-12-17 16:40:02 · 1517 阅读 · 0 评论 -
【深度学习目标检测】八、基于yolov5的抽烟识别(python,深度学习)
本文介绍了基于Yolov5的抽烟检测模型,包括训练过程和数据准备过程,同时提供了推理的代码。对准备计算机视觉相关的毕业设计的同学有着一定的帮助。原创 2023-12-17 15:35:06 · 1694 阅读 · 0 评论 -
【深度学习目标检测】七、基于深度学习的火灾烟雾识别(python,目标检测,yolov8)
本文介绍了基于Yolov8的火焰烟雾检测模型,包括训练过程和数据准备过程,同时提供了推理的代码。对准备计算机视觉相关的毕业设计的同学有着一定的帮助。原创 2023-12-15 18:14:11 · 3286 阅读 · 0 评论 -
【深度学习目标检测】六、基于深度学习的路标识别(python,目标检测,yolov8)
本文介绍了基于Yolov8的路标检测模型,包括训练过程和数据准备过程,同时提供了推理的代码。对准备计算机视觉相关的毕业设计的同学有着一定的帮助。原创 2023-12-15 17:05:49 · 1756 阅读 · 0 评论 -
【深度学习目标检测】四、基于深度学习的抽烟识别(python,yolov8)
YOLOv8是一种物体检测算法,是YOLO系列算法的最新版本。本文使用yolov8检测抽烟行为,适合本科毕业设计和深度学习入门者。原创 2023-12-14 18:32:57 · 2648 阅读 · 5 评论 -
【深度学习目标检测】五、基于深度学习的安全帽识别(python,目标检测)
深度学习目标检测方法则是利用深度神经网络模型进行目标检测,主要有以下几种:R-CNN系列:包括R-CNN、Fast R-CNN、Faster R-CNN等,通过候选区域法生成候选目标区域,然后使用卷积神经网络提取特征,并通过分类器对每个候选区域进行分类。SSD:Single Shot MultiBox Detector,通过在特征图上利用不同大小和形状的卷积核进行目标检测,同时预测目标的类别和位置。原创 2023-12-14 17:59:57 · 2000 阅读 · 0 评论 -
【深度学习目标检测】三、基于深度学习的人物摔倒检测(python,yolov8)
本文介绍了基于Yolov8的任务摔倒检测模型,包括训练过程和数据准备过程,同时提供了推理的代码。对准备计算机视觉相关的毕业设计的同学有着一定的帮助。原创 2023-12-13 18:58:30 · 1778 阅读 · 5 评论 -
【深度学习】注意力机制(三)
本文介绍一些注意力机制的实现,包括EMHSA/SA/SGE/AFT/Outlook Attention。原创 2023-12-11 13:41:37 · 1642 阅读 · 0 评论 -
【深度学习】注意力机制(一)
本文介绍一些注意力机制的实现。原创 2023-12-10 13:09:43 · 2971 阅读 · 2 评论 -
【论文笔记】DeiT论文阅读笔记
针对ViT难训练的问题,DeiT提出参数设置、数据增强、知识蒸馏来更有效地训练ViT。DeiT提出的训练方法成为后续ViT模型的训练标注。原创 2022-04-05 20:59:42 · 4229 阅读 · 0 评论 -
【论文笔记】Swin-Transformer系列阅读笔记
本文提出了一个计算机视觉任务中的通用backbone模型:Swin Transformer。Swin将self-attention限制在局部窗口内进行,降低了Attention的计算量,同时利用滑动窗口机制使得不同窗口间建立联系,Swin在各个视觉任务屠榜(一个字:强)。...原创 2022-04-03 19:40:48 · 3601 阅读 · 0 评论 -
【论文笔记】MetaFormer/PoolFormer 论文笔记及体验
Transformer已经证明在计算机视觉任务中有非常大的潜力,一种普遍的看法是基于attention的token mixer模块使transformer具有竞争力。但是将attention用spatial MLP替代后,模型仍然具有非常好的效果。那么是不是transformer的结构而不是attention使其有效呢?作者使用池化层代替transformer中的attention,构建了PoolFormer模型,取得了非常好的效果,ImageNet-1k准确率达到82.1%。证明了Transformer结原创 2022-04-03 11:38:05 · 3549 阅读 · 0 评论 -
【Matting】MODNet:实时人像抠图模型-onnx C++部署
本文将使用C++部署MODNet模型,实现图片Matting和摄像头Matting功能。原创 2022-03-28 10:40:04 · 7432 阅读 · 15 评论 -
【Matting】MODNet:实时人像抠图模型-onnx python部署
MODNet是一个实时Matting的深度学习模型,本文是MODNet的模型部署教程,将MODNet的onnx模型使用python部署,实现了图片Matting,视频Matting等功能。原创 2022-03-28 09:32:25 · 9653 阅读 · 24 评论 -
【Matting】MODNet:实时人像抠图模型-笔记
现有的Matting方法常常需要辅助的输入如tripmap才能获得好的效果,但是tripmap获取成本较高。MODNet是一个不需要Trimap的实时抠图算法,在1080Ti FPS可达到67。原创 2022-03-27 18:21:53 · 13987 阅读 · 4 评论 -
【论文笔记】ConvNeXt论文阅读笔记
自从ViT出现,在分类任务中很快取代各种CNN网络拿下SOTA。ViT的模型设计结构和传统的CNN结构差异很大,会不会是CNN的设计结构限制了CNN的能力呢?如果把CNN的结构设计成和ViT类似,CNN又会有什么样的表现呢?Transformer的设计结构会影响CNN的性能吗?实验证明,CNN依然有效!仿照Transformer结构,作者对ResNet结构进行修改,实验证明修改后ResNet50的性能超过了Swin-T。原创 2022-03-23 11:51:03 · 3377 阅读 · 0 评论 -
【语义分割】语义分割上采样方法汇总
在语义分割模型中,一般通过Backbone获得不同分辨率的特征图,然后将特征图融合生成预测结果,在此过程中,不可避免地需要将低分辨率特征图进行上采样提高其分辨率,本文统计了常用的上采样方法,并给出部分上采样算法的numpy实现代码,与opencv进行对比检验代码的正确性。一、插值插值利用像素间的相互关系计算出1、最近邻插值最近邻插值是最简单的插值方法,选取离目标点最近的点作为新的插入点,如下图示例:numpy实现及opencv对比:import cv2from math i.原创 2022-03-22 18:09:19 · 3832 阅读 · 0 评论 -
【深度学习目标检测】一、基于yolov3的水果商品检测分类
基于深度学习的水果商品检测分类看到一个水果数据集,共包含3种水果(苹果、香蕉、橘子),正好在学习yolo,就用yolo做个实践,检测水果并识别其种类。原图及检测效果图如下:数据集介绍数据集格式为VOC格式,共包含3类图片(苹果,香蕉和橘子),每类有100张图片,其中80张用于训练集,20张用于验证集。数据集目录如下:数据集部分图片:检测模型本文采用YOLOV3算法进行目标检测,backbone选择MobileNetV3,使用PaddleDetection进行训练,训练250轮结果后,原创 2021-04-28 09:16:57 · 9857 阅读 · 0 评论 -
【论文笔记】RepLKNet论文阅读笔记
自从VGG提出以后,各种CNN网络层出不穷,但是他们都遵循了VGG的设计思想,通过多个小卷积核叠加来得到大的感受野同时保证较少的参数量(2各3x3的卷积核感受野和5x5的卷积核感受野相同,但是参数18<25)。随着ViT逐渐在各类视觉任务种拿到SOTA的表现,CNN似乎有点后继无力。RepLKNet打破了这种现象,提出使用在CNN网络中使用大的卷积核,RepLKNet在各类视觉任务中获得了SOTA表现。原创 2022-03-21 20:31:04 · 2447 阅读 · 0 评论