CNN
文章平均质量分 84
justld
努力努力再努力
展开
-
【nnUNetv2实践】一、nnUNetv2安装
nnUNet是一个自适应的深度学习框架,专为医学图像分割任务设计。此外,nnUNet还提供了丰富的文档和示例,帮助用户更好地了解和使用该框架。要使用nnUNet,用户需要安装Python和相应的深度学习框架,然后按照官方文档提供的步骤进行操作即可。总的来说,nnUNet是一个功能强大、易于使用的深度学习框架,特别适用于医学图像分割任务。它的自适应特性、自动化流程和先进的训练策略使得用户能够更高效地构建和训练模型,同时获得更好的性能表现。本文介绍nnunetv2的安装方法。原创 2024-03-18 13:08:17 · 4752 阅读 · 22 评论 -
【深度学习目标检测】十七、基于深度学习的洋葱检测系统-含GUI和源码(python,yolov8)
总之,使用AI实现洋葱检测可以提高农业生产的效率和农产品质量,促进农业现代化发展。以下是此项目的一些用例:1.杂货库存管理:洋葱检测器可用于超市和杂货店,通过准确识别和计数存储区域或展示架上的洋葱,自动监控和管理洋葱的库存和库存。2.洋葱收获自动化:使用洋葱检测器模型开发收获自动化设备可以帮助农民和农业公司检测和分离除草植物或土壤中的洋葱,显着提高洋葱收获过程的速度和效率。原创 2024-01-21 11:45:19 · 1185 阅读 · 0 评论 -
【深度学习目标检测】十六、基于深度学习的麦穗头系统-含GUI和源码(python,yolov8)
全球麦穗检测是植物表型分析领域的一个挑战,主要目标是检测图像中的小麦麦穗。这种检测在农业领域具有重要意义,可以帮助农民评估作物的健康状况和成熟度。然而,由于小麦麦穗在视觉上具有挑战性,准确检测它们是一项艰巨的任务。全球麦穗检测的挑战在于准确识别不同品种、不同生长环境、不同光照条件、不同拍摄角度下的麦穗。由于小麦麦穗经常重叠、颜色和外观变化多样,这使得检测更具挑战性。为了解决这些问题,研究者们采用机器学习和计算机视觉技术来开发麦穗检测算法。原创 2024-01-13 14:41:22 · 1631 阅读 · 2 评论 -
【深度学习目标检测】十五、基于深度学习的口罩检测系统-含GUI和源码(python,yolov8)
YOLOv8是一种物体检测算法,是YOLO系列算法的最新版本。YOLO(You Only Look Once)是一种实时物体检测算法,其优势在于快速且准确的检测结果。YOLOv8在之前的版本基础上进行了一系列改进和优化,提高了检测速度和准确性。YOLOv8采用了Darknet-53作为其基础网络架构。Darknet-53是一个53层的卷积神经网络,用于提取图像特征。与传统的卷积神经网络相比,Darknet-53具有更深的网络结构和更多的卷积层,可以更好地捕捉图像中的细节和语义信息。原创 2024-01-13 12:47:01 · 1441 阅读 · 0 评论 -
【深度学习目标检测】十四、基于深度学习的血细胞计数系统-含GUI(BCD数据集,yolov8)
血细胞计数是医学上一种重要的检测手段,用于评估患者的健康状况,诊断疾病,以及监测治疗效果。而目标检测是一种计算机视觉技术,用于在图像中识别和定位特定的目标。在血细胞计数中,目标检测技术可以发挥重要作用。首先,血细胞计数通常需要处理大量的血液样本,手动计数每个细胞既耗时又容易出错。使用目标检测算法,可以自动识别和计数图像中的血细胞,大大提高了计数的准确性和效率。其次,不同的血细胞(如红细胞、白细胞和血小板)具有不同的形态和大小,这使得使用传统的图像处理方法进行区分和计数变得困难。原创 2024-01-11 12:33:17 · 1057 阅读 · 0 评论 -
【深度学习目标检测】十三、基于深度学习的血细胞识别(python,目标检测,yolov8)
血细胞计数是医学上一种重要的检测手段,用于评估患者的健康状况,诊断疾病,以及监测治疗效果。而目标检测是一种计算机视觉技术,用于在图像中识别和定位特定的目标。在血细胞计数中,目标检测技术可以发挥重要作用。首先,血细胞计数通常需要处理大量的血液样本,手动计数每个细胞既耗时又容易出错。使用目标检测算法,可以自动识别和计数图像中的血细胞,大大提高了计数的准确性和效率。其次,不同的血细胞(如红细胞、白细胞和血小板)具有不同的形态和大小,这使得使用传统的图像处理方法进行区分和计数变得困难。原创 2024-01-11 10:28:28 · 1697 阅读 · 0 评论 -
【目标检测】yolov8结构及代码分析
yolov8的整体结构如下图(来自mmyolo):可以看出,主要包含Conv,C2f,SPPF,Concat,Detect几个模块。原创 2023-12-30 10:26:57 · 3212 阅读 · 2 评论 -
【论文笔记】Run, Don’t Walk: Chasing Higher FLOPS for Faster Neural Networks
该论文主要提出了PConv,通过优化FLOPS提出了快速推理模型FasterNet。在设计神经网络结构的时候,大部分注意力都会放在降低FLOPs( floating-point opera-tions)上,有的时候FLOPs降低了,并不意味了推理速度加快了,这主要是因为没考虑到FLOPS(floating-point operations per second)。针对该问题,作者提出了PConv( partial convolution),通过提高FLOPS来加快推理速度。原创 2023-12-26 10:41:23 · 1066 阅读 · 3 评论 -
【论文笔记】MCANet: Medical Image Segmentation withMulti-Scale Cross-Axis Attention
医疗图像分割任务中,捕获多尺度信息、构建长期依赖对分割结果有非常大的影响。该论文提出了 Multi-scale Cross-axis Attention(MCA)模块,融合了多尺度特征,并使用Attention提取全局上下文信息。原创 2023-12-20 18:38:40 · 2667 阅读 · 6 评论 -
【论文笔记】AK卷积(Convolutional Kernel with Arbitrary Sampled Shapes and Arbitrary Number of Parameters)
本文介绍AK卷积,传统的卷积有2个缺陷:1、卷积运算在固定大小的窗口运行、无法捕获其他窗口的信息,并且窗口的形状是固定的;2、卷积核的尺寸固定为,窗口大小固定为k,随着k增加,参数会快速增加。针对传统卷积的缺陷,作者提出了AK卷积,AK卷积拥有任意形状和任意的参数。作者在yolov5n和yolov8n上进行了测试,效果非常好。原创 2023-12-20 16:10:05 · 2434 阅读 · 0 评论 -
【论文笔记】动态蛇卷积(Dynamic Snake Convolution)
精确分割拓扑管状结构例如血管和道路,对医疗各个领域至关重要,可确保下游任务的准确性和效率。然而许多因素使分割任务变得复杂,包括细小脆弱的局部结构和复杂多变的全局形态。针对这个问题,作者提出了动态蛇卷积,该结构在管状分割任务上获得了极好的性能。原创 2023-12-19 12:16:02 · 7341 阅读 · 4 评论 -
【深度学习】注意力机制(七)Agent Attention
本文介绍Agent Attention注意力机制,Transformer中的Attention模块可以提取全局语义信息,但是计算量太大,Agent Attention是一种计算非常有效的Attention模块。论文:Agent Attention: On the Integration of Softmax and Linear Attention代码:https://github.comA/leaplabthu/agent-attentionSoftmax Attention,Linear Attenti原创 2023-12-19 10:37:43 · 5535 阅读 · 5 评论 -
【深度学习】注意力机制(六)
本文介绍一些的实现,包括MobileVITv1/MobileVITv2/DAT/CrossFormer/MOA。原创 2023-12-13 18:13:18 · 1751 阅读 · 0 评论 -
【深度学习】注意力机制(五)
本文介绍一些的实现,包括CSRA/Spatial Shift/Triplet Attention/Coordinate Attention/ACmix。原创 2023-12-12 18:23:48 · 1876 阅读 · 0 评论 -
【深度学习】注意力机制(四)
本文介绍一些的实现,包括VIP/CoAtNet/Scaling Local Self-Attention/PSA/CoT。原创 2023-12-12 17:56:33 · 1479 阅读 · 0 评论 -
【深度学习】注意力机制(二)
本文介绍一些注意力机制的实现,包括EA/MHSA/SK/DA/EPSA。原创 2023-12-11 13:12:35 · 1427 阅读 · 0 评论 -
【模型部署】PaddleOCR模型openvino部署(二)
上一篇博客【模型部署】PaddleOCR模型openvino部署(一)介绍了PaddleOCR检测模型DBNet的部署方法,本篇将介绍文本方向分类、文本识别的 部署方法,同时将检测、方向分类、文本识别模型串联起来,给出完整的部署流程。原创 2022-04-26 20:59:11 · 3556 阅读 · 3 评论 -
【论文笔记】CCNet阅读笔记
上下文信息在语义分割任务中非常重要,CCNet提出了criss-cross attention模块,同时引入循环操作,使得图片中每个像素都可以和其他像素建立联系,从而使得每个像素都可以获得丰富的语义信息原创 2022-04-14 19:54:36 · 1169 阅读 · 0 评论 -
【论文笔记】DDRNet论文阅读笔记及复现
轻量级语义分割模型大致分为2类:Encoder-Decoder结构(如ESPNet)和two-pathway(如BiSeNet)。类似two-pathway结构,DDRNet使用Dual-resolution,并引入DAPPM(Deep Aggregation Pyramid Pooling Module)模块。在Cityscapes测试集、GPU 2080Ti,DDRNet-23-slim达到102FPS,miou77.4%。原创 2022-04-08 20:19:55 · 3074 阅读 · 5 评论 -
【论文笔记】OCRNet论文阅读笔记
语义分割任务中,像素所属的类别就是像素所在的对象的类别,能不能利用像素和其所属目标的关系呢?OCRNet提出了一个有效方法,利用像素所属的目标的上下文信息来提升像素的表征能力(representation)。原创 2022-03-25 10:34:44 · 2142 阅读 · 0 评论 -
【论文笔记】ConvNeXt论文阅读笔记
自从ViT出现,在分类任务中很快取代各种CNN网络拿下SOTA。ViT的模型设计结构和传统的CNN结构差异很大,会不会是CNN的设计结构限制了CNN的能力呢?如果把CNN的结构设计成和ViT类似,CNN又会有什么样的表现呢?Transformer的设计结构会影响CNN的性能吗?实验证明,CNN依然有效!仿照Transformer结构,作者对ResNet结构进行修改,实验证明修改后ResNet50的性能超过了Swin-T。原创 2022-03-23 11:51:03 · 3355 阅读 · 0 评论