CVer儿
开源让世界更美好
展开
-
AMSA-UNet | 基于自注意力的多尺度 U-Net 提升图像去模糊性能
传统的单尺度U-Net在去模糊过程中常常会导致空间信息的丢失,这影响了去模糊的准确性。此外,由于卷积方法在捕捉长距离依赖方面的局限性,恢复图像的质量下降。为了解决上述问题,提出了一种基于自注意力的非对称多尺度U-Net(AMSA-UNet)来提高去模糊方法在准确性和计算复杂度方面的性能。通过引入多尺度U形结构,网络可以在全局层面关注模糊区域,并在局部层面更好地恢复图像细节。原创 2024-07-02 17:39:26 · 85 阅读 · 0 评论 -
Segment anything in medical images
通过在广泛的任务中提供准确、高效的分割,MedSAM 在加速诊断工具的发展和治疗计划的个性化方面具有巨大的潜力。在两种不同的数据集大小上训练了MedSAM:10000 (10K) 和 100,000 (100K) 图像,并将它们的性能与默认的 MedSAM 模型进行了比较。:从多个来源(如TCIA、Kaggle、Grand-Challenge等)整合了医学图像分割数据集,这些数据集都包含了由人类专家提供的分割注释,确保了数据的质量和准确性。:在图像和掩模的调整过程中,根据需求选择了不同的插值方法。原创 2024-06-18 16:35:42 · 77 阅读 · 0 评论 -
基于新型切片轮廓转换超分辨率的深度生成网络的高分辨率3D MRI重建
通过训练深度生成网络实现了5.5倍的超分辨率重建,与SMORE超分辨率重建方法和常规降采样训练的网络相比,该研究的SPTSR框架在50个测试案例中展示了最佳的整体图像质量。该研究所提出的SPTSR框架的目标是从单个2D切片堆叠的一个方向(例如,冠状MRI扫描)进行训练,并利用正交方向(例如,轴向MRI扫描)推理各向同性高分辨率的3D成像。与简单的双线性插值相比,SMORE和KS-ZF训练的网络去除了大部分阶梯和模糊伪影,但未能重建前列腺内的小结构,并且存在放大的噪声。因此,通过平面的推理。原创 2024-06-18 16:25:18 · 230 阅读 · 0 评论 -
结合小波变换的遥感语义分割网络,融合频域和空间域特征提升分割效果
题目:SFFNet: A Wavelet-Based Spatial and Frequency Domain Fusion Network for Remote Sensing Segmentation论文:http://arxiv.org/abs/2405.01992代码:https://github.com/yysdck/SFFNet年份:2024。原创 2024-05-15 14:39:26 · 130 阅读 · 0 评论 -
GRFB-UNet:一种新的多尺度注意力网络,用于铺路分割
因此,识别铺装的形状和位置以支持视障人士的移动性是相当有意义的,而视觉分割技术就适合这项任务。为了有效提高触觉铺装分割的精度和鲁棒性,该文提出一种结合UNet网络和多尺度特征提取的新型触觉铺装分割方法。在UNet网络中增加群感受野块(GRFB)的结构,得到触觉铺装的多尺度感受野。同时,在各组卷积后采用小尺度卷积,实现跨信道信息交互与整合,旨在提取更丰富的高级特征。本文构建了各种场景下的铺路数据集,并进行了标记以进行实验评估。实验结果表明,所提网络在铺装分割方面取得了较好性能,为铺路检测提供了有价值的参考。原创 2024-05-14 11:17:55 · 106 阅读 · 1 评论 -
UNetformer实现遥感城市场景影像的高效语义分割
UNetFormer:一种类似UNet的转换器,用于遥感城市场景影像的高效语义分割,ISPRS。此外,还包括用于卫星、航空图像和无人机图像分割。原创 2024-05-14 10:44:09 · 258 阅读 · 0 评论 -
极简代码遥感语义分割,结合GDAL从零实现
定义的是经典的U-Net网络,相对于论文原模型稍作了修改。原文DOI:10.1007/978-3-319-24574-4_28。原创 2024-05-08 09:50:05 · 78 阅读 · 0 评论 -
使用增强型 ResUnet 进行遥感建筑物提取
修改残差 U-Net (Modified ResUnet) 并应用后处理提取大田地区的城市建筑。原创 2024-03-22 17:56:17 · 96 阅读 · 0 评论 -
PROSTATEx-2 上前列腺癌的 3D CNN 分类
结果表明,虽然很难单独从每种模式判断病变应该是阳性还是阴性,但当应该是阳性(真阳性和假阴性)时,堆叠模式显示的白色多于灰色,并且显示的灰色多于病变。由于所有患者的 T2 序列的分辨率并不相同,因此图像的每个像素代表现实世界长度中的不同毫米。(顶行)未配准的 T2、ADC、DWI 图像,(btm 行)共同配准的 T2、ADC、DWI,描绘为图像文件的三个通道。在病变中心裁剪所需数量的像素后,所有裁剪图像的大小都会调整为 60X60 分辨率,这是裁剪后最常见的分辨率。未使用 T2 矢状序列,即前列腺的侧视图。原创 2023-10-23 18:25:13 · 1428 阅读 · 0 评论 -
an adaptive shuffle attention (ASA) module
F-UNet++:基于多用途自适应shuffle注意力和复合多输入重建网络的遥感图像融合”,在这项工作中,自适应洗牌注意力(ASA)模块和优化的 UNet++ 结合在融合 UNet++(F-UNet++)框架中,用于解决 MS 和 PAN 图像融合问题。原创 2023-07-26 13:56:07 · 551 阅读 · 0 评论 -
裂缝处理优化策略
将原始数据标签处理为两类,正常和裂缝原始图片均为320*480,使用的显卡为2080,内存足够,不进行图片大小调整。原创 2023-07-25 17:17:14 · 274 阅读 · 0 评论 -
libtorch水下图像增强模型和基准数据集
此外,我们提出了一个在此基准上训练的水下图像增强网络(称为 Water-Net)作为基线,这表明了所提出的 UIEB 用于训练卷积神经网络(CNN)的泛化。此外,我们提出了一个在此基准上训练的水下图像增强网络(称为 Water-Net)作为基线,这表明了所提出的 UIEB 用于训练卷积神经网络(CNN)的泛化。此外,我们提出了一个在此基准上训练的水下图像增强网络(称为 Water-Net)作为基线,这表明了所提出的 UIEB 用于训练卷积神经网络(CNN)的泛化。60 张具有挑战性的水下图像。原创 2023-07-19 18:30:15 · 1461 阅读 · 0 评论 -
UNet-U2Net-MultiResUNet-for-vessel-Segmentation视网膜血管分割
在本研究中,使用了 U-Net 模型(生物医学图像分割最成功的深度学习模型)和受 U-Net 架构启发的 U2-Net 模型。在本研究中,scimage、sci-kit learn、OpenCV、albumentations 库用于使用 U-Net、U2-Net 模型 Tensorflow 背景的 Keras 进行数据增强和预处理。除了 U-Net 的这些功能之外,U2-Net 可以更好地捕获浅层和深层的局部和整体信息,无论分辨率如何 [3]。准确度、灵敏度、特异性、精密度、ppv、f1 分数。翻译 2023-07-19 18:22:36 · 264 阅读 · 0 评论 -
【无标题】
本质上,子像素卷积的作用是将尺寸为 10 x 10 x 64 的特征图压缩为另一个具有浅深度的更大特征图(如果上采样率为 8,则为 80 x 80 x 1)。例如,它可以用于执法。然而,我们的模型无法使用原始数据,它只需要车牌图像,而不是街景和汽车。在好莱坞犯罪电影中,我们经常看到侦探在一位电脑极客的帮助下破获疑难案件,这些极客可以从模糊、低质量的图像中揭示隐藏的信息。论文中,研究人员发现了一种新颖的内容损失函数,该函数在 VGG 网络的特征空间中计算 MSE,突出显示突出的图像特征,而不是在图像空间中。翻译 2023-07-19 18:07:45 · 67 阅读 · 0 评论 -
天池数字生态创新大赛-遥感
在分隔训练集和验证集时,我们在连续五个数据中取其中四份做训练数据,其中一份做验证数据。我们需要了解一下我们的数据中每个类的像素占比情况,对我们后续处理和分析有一定的帮助,运行程序为"code\count_classes.py"。我们对类别像素占比很少的类别进行上采样处理,抵抗不均衡现象。若图像包含类别5、6、7则上采样2份,类别3、8、10因为得分太低,采取放弃策略,类别4几乎每张影像都有,亦采取放弃策略。为了模拟不同域,我们使用全部数据作为训练集,全部数据作为验证集,只不过训练集和验证集的增强方式不同。原创 2023-05-16 14:30:19 · 530 阅读 · 0 评论 -
UTNet:A Hybrid Transformer Architecture for Medical Image Segmentation
再通过堆叠不同层次提取的局部特征,逐步扩大感受野,获得更高层次的全局特征。Fig 2分别展示了在Transformer encoder和decoder中使用的多头自注意力模块(MHSA),他们流程相似,但是decoder中输入有两个,一个是通过skip connection连接过来的encoder的特征图,一个则是decoder前一层的低分辨率的feature map。这一相似程度随后会作为权重 乘以value的值,这样就计算出了注意力,并且基于的感受野是全局的感受野,是将所有的输入都考虑其中的。翻译 2023-05-07 20:51:27 · 205 阅读 · 0 评论 -
TransNetR:基于transformer的残差网络息肉分割 (MIDL 2023)
TransNetR 是一种编码器解码器网络,可用于高效生物医学图像分割。分布内和分布外数据集图 1:预期在现实世界中出现的不同场景的图示。拟议的工作同时进行了分布内和分布外验证过程。C1 到 C6 代表 PolypGen 数据集中存在的不同中心数据 width=50% height=50%TransNetR图 2:TransNetR 的框图以及 Residual Transformer 块结果(定性结果)图 3:在 Kvasir-SEG 上显示息肉分割的定性示例结果(定性结果)原创 2023-04-11 11:47:13 · 602 阅读 · 0 评论 -
Multi-scaleSR_For_MRI_Blur多尺度神经网络来进行核磁共振图像的去除伪影操作
同时我们创造性的提出了一种不同于以往的更宽更深的残差块(DW-ResBlock)(下图c),这种结构使得图像的特征提取的更为充分,同时可以减少网络的层数,使得训练的时间减少,网络的效果基本不变。这个代码的目的是使用一种多尺度的神经网络来对含有伪影的核磁共振图像进行矫正,伪影在核磁共振图像中很常见,多是由于患者的不自主运动(如肌肉骨骼痉挛,或是心律不齐引起的心房颤动)引起。大部分实际的伪影是不太明显的(有些只有专业的医生才能分辨)(上面的图像比较明显,下面的不明显)本算法使用一种多尺度的网络结构。原创 2023-04-06 14:52:43 · 279 阅读 · 0 评论 -
NCHW - NHWC - CHWN 排列
TensorFlow有两种数据格式NHWC和NCHW,默认的数据格式是NHWC,可以通过参数data_format指定数据格式。这个参数规定了 input和 output Tensor 的排列方式。原创 2023-02-19 22:14:02 · 367 阅读 · 0 评论 -
点云配准的全面综述
点云配准是点云之间的变换估计问题,从优化的角度来看,它经历了很长的发展历史。最近,深度学习的成功极大地提高了配准的鲁棒性和效率。本综述试图对基于优化的学习方法与深度学习方法进行全面的回顾,并建立两者之间的联系,以提供进一步的研究启示。此外,随着三维传感器和三维重建技术的发展,一个新的研究方向也应运而生。本文回顾了跨源点云配准的发展,并建立了一个新的基准来评价现有的配准算法。此外,本调查总结了基准数据集,并讨论了跨不同领域的点云配准的应用。最后,本文提出了这一快速发展领域的潜在研究方向。原创 2023-02-16 02:11:12 · 594 阅读 · 0 评论 -
APAUNet: Axis Projection Attention UNet for Small Target Segmentation in 3D Medical Images. In ACCV
最后,在 APA 解码器中,我们在 2D 投影过程中连接高分辨率和低分辨率特征,从而获得更精确的多尺度信息,这对于小病灶分割至关重要。具体而言,APAUNet 在 BTCV 上的平均骰子得分为 87.84,在 MSD-Liver 上为 84.48,在 MSD-Pancreas 上为 69.13,并且在小目标上显着超过了之前的 SOTA 方法。考虑到 3D 特征空间中背景的比例很大,引入了一种投影策略,将 3D 特征投影到三个正交的 2D 平面中,以捕获来自不同视图的上下文注意力。原创 2023-02-10 14:21:28 · 178 阅读 · 0 评论 -
超清遥感影像语义分割处理
分割出城市中的垃圾堆场,遂寻找到了这个数据集和对应的。原创 2023-02-10 13:42:30 · 751 阅读 · 1 评论 -
BASNet调研
说起显著性检测这两年集大成者为u^2net和basnet原创 2022-12-13 13:44:21 · 513 阅读 · 1 评论 -
MICCAI 2022:基于 MLP 的快速医学图像分割
前言方法概述UNeXt 架构TokMLP 设计思路实验部分一些理解和总结参考链接最近 MICCAI 2022 的论文集开放下载了,地址:https://link.springer.com/book/10.1007/978-3-031-16443-9 ,每个部分的内容如下所示:其中关于分割有两个部分,Image segmentation I 在 Part IV, 而 Image segmentation II 在 Part V。计划对其中开放源代码和典型的方法注意解读,这次要分享的论文是其中的 UNeX翻译 2022-12-06 22:20:04 · 745 阅读 · 0 评论 -
农作物地块范围识别思路
农作物的资产盘点与精准产量预测是实现农业精细化管理的核心环节。当前,我国正处于传统农业向现代农业的加速转型期,伴随着农业的转型升级,政府宏观决策、社会各界对农业数据的需求不断增加,现有农业统计信息的时效性与质量,已不足以为市场各主体的有效决策提供科学依据。在农作物资产盘点方面,传统的人工实地调查的方式速度慢、劳动强度大,数据采集质量受主观因素影响大,统计数据有较大的滞后性,亟待探索研究更高效准确度更高的农业调查统计技术。在产量预测方面,及时准确地获取区域作物单产及其空间分布信息,对作物进行精准的产能预测,对原创 2022-05-26 13:24:18 · 295 阅读 · 0 评论 -
Attention-Guided Version of 2D UNet for Automatic Brain Tumor Segmentation
tf2模型代码:import tensorflow.keras.backend as Kfrom tensorflow.keras.models import Modelfrom tensorflow.keras import Inputfrom tensorflow.keras.layers import Conv2D, PReLU, UpSampling2D, concatenate , Reshape, Dense, Permute, MaxPool2Dfrom tensorflow.k原创 2022-04-25 10:32:21 · 421 阅读 · 0 评论 -
SA-Net:用于医学图像分割的尺度注意网络 A scale-attention network for medical image segmentation
医学图像的语义分割为后续的图像分析和理解任务提供了重要的基石。随着深度学习方法的快速发展,传统的 U-Net 分割网络已在许多领域得到应用。基于探索性实验,已发现多尺度特征对于医学图像的分割非常重要。在本文中,我们提出了一种尺度注意力深度学习网络(SA-Net),它在残差模块中提取不同尺度的特征,并使用注意力模块来增强尺度注意力能力。SA-Net 可以更好地学习多尺度特征,对不同的医学图像实现更准确的分割。此外,这项工作在多个数据集上验证了所提出的方法。实验结果表明,SA-Net 在视网膜图...原创 2023-07-19 18:13:37 · 1093 阅读 · 0 评论 -
特征融合—高低层(多尺度)特征融合
目录概述 基本概念 典型方法概述 相关工作:多尺度模型设计 Deep Feature Fusion for VHR(高分辨率图像) Remote Sensing Scene Classification(DCA特征融合方法) 基于神经网络的目标检测论文之目标检测方法:改进的SSD目标检测算法(DensNet) FPN(feature pyramid networks) YOLOv3——引入:FPN+多尺度检测 (目标检测)(one-stage)(深度学习)(CVPR 2018) 融合特.原创 2022-01-11 13:59:22 · 1205 阅读 · 0 评论 -
重新思考空洞卷积 | RegSeg超越DeepLab、BiSeNetv2让语义分割实时+高精度
语义分割的最新的一些研究通常采用ImageNet预训练Backbone,在其后面加上特殊的上下文模块,以快速增加感受野。虽然取得了一定的效果,但是Backbone也带来了大部分计算。最近的一些进展解决了这个问题,方法是快速降低Backbone的分辨率,同时拥有一个或多个具有更高分辨率的平行分支。作者采用了不同的方法,设计了一个受ResNeXt启发的Block结构,使用2个具有不同的膨胀率的并行3x3卷积层,以扩大感受野,同时保留局部细节。通过在Backbone中重复这个Block结构,不需要在它后...转载 2021-11-24 14:36:31 · 1417 阅读 · 5 评论 -
轻量人像分割SINet
引入随着算力和算法的不断提升,能够训练的模型也越来越大了,当然精度也越来越高了 不过过于巨大的模型也带来了部署上的不便 今天就介绍两个轻量级的人像分割模型:SINet 和 ExtremeC3Net项目说明项目模型转换至开源项目ext_portrait_segmentation 感谢上述项目提供的开源代码和模型模型规格具体的模型规格如下表: model Param Flop SINet 0.087 M 0.064 G ExtremeC3原创 2021-11-10 16:38:41 · 4246 阅读 · 0 评论 -
Spatial Attention U-Net for Retinal Vessel Segmentation(ICPR 2020)
总的来讲,改进比较常规,引入dropblock,并在桥接阶段加入空间注意力。keras实现modelDropblock.pyimport kerasimport keras.backend as Kclass DropBlock1D(keras.layers.Layer): """See: https://arxiv.org/pdf/1810.12890.pdf""" def __init__(self, block_s...原创 2021-10-15 22:42:50 · 582 阅读 · 0 评论 -
3D智能抠图算法新思路:实现复杂背景下的通用抠图
1. 背景随着视频功能的广泛使用,直播带货和视频会议产业蓬勃发展。抠图作为一项将目标物体和背景分离的技术,被广泛应用于直播带货和视频会议领域。比如,在直播带货时,通过将背景渲染成华丽的直播间来吸引粉丝。又比如,在视频会议时,将家庭背景替换为其他背景,来保护与会者的隐私。然而,传统的2D抠图存在较多局限性。奥比中光自研的最新3D智能抠图算法,能够很好地弥补2D抠图的缺点。绿幕抠图用于直播带货和人像抠图用于视频会议2.2D抠图存在的问题2.1. 绿幕抠图:成本高,使用困难,不能抠绿.翻译 2021-10-09 13:25:12 · 686 阅读 · 0 评论 -
Deep Residual U-Net (ResUNet)
Paper:https://arxiv.org/pdf/1711.10684.pdfResUNet, a semantic segmentation model inspired by the deep residual learning and UNet. An architecture that take advantages from both(Residual and UNet) models.1.1 AdvantagesThe residual unit will ease the .原创 2021-08-21 12:00:33 · 4353 阅读 · 1 评论 -
实时语义分割算法大盘点
语义分割论文语义图像分割是计算机视觉中发展最快的领域之一,有着广泛的应用。在许多领域,如机器人和自动驾驶汽车,语义图像分割是至关重要的,因为它提供了必要的上下文,以采取行动,基于对场景的理解在像素级。对于图像的理解有一下几个层次: 分类,即将图像中最具代表性的物体归为某一个类; 带有定位的分类,对分类任务的一个扩展,使用边界框将对象框起来在分类; 目标检测,对多个不同类型的对象进行分类和定位; 语义分割,是对图像中的每个像素进行分类和定位; 实例分割,是转载 2021-08-17 15:38:32 · 3030 阅读 · 0 评论 -
LadderNet:用于医学图像分割的基于U-NET的多路径网络
《LadderNet: MULTI-PATH NETWORKS BASED ON U-NET FOR MEDICAL IMAGE SEGMENTATION》链接:https://arxiv.org/pdf/1810.07810.pdfParameter definationparameters (path, patch size, et al.) are defined in"configuration.txt" training parameters are defined in sr.原创 2021-08-17 15:23:38 · 844 阅读 · 0 评论 -
语义分割中FPN多尺度特征的配准问题
1.问题阐述语义分割的目的是给每一个像素进行正确的分类,这个定义提供了一种从分类视角看待问题的思路,但不能很好的阐述语义分割所面临的关键问题。顾名思义,语义分割是将图像分成若干块,同时获取块的类别,也就是语义信息。这其中有两个关键,一是分割的准确性,保证每个类边缘的准确;二是类别预测的准确性。要准确预测类别,需要利用深层的网络提取语义特征,而随着网络层数的加深,边缘细节不可避免的损失掉了。很直观的我们可以用边界预测的方式来解决这个问题,也的确有很多论文这么做。但更多的论文是通过融合多尺度特征来保转载 2021-08-16 10:11:10 · 1113 阅读 · 0 评论 -
直播时各种背景是怎么实现, 虚拟背景背后的技术
作者丨羿川来源丨视频云技术编辑丨极市平台极市导读由于疫情的影响,各大在线办公软件都相继推出了虚拟背景功能,本文详细介绍了虚拟背景相关的技术文章如实时语义分割、人像分割等。>>加入极市CV技术交流群,走在计算机视觉的最前沿2020 年一场突如其来的疫情闯进了我们的生活,上网课、在家办公逐渐成为了一种常态,为了更好地保护用户隐私、提升用户体验,各大在线办公软件相继推出了虚拟背景功能,营造学习、办公氛围的同时,又能避免家中环境不够正式的窘境。那么今天我们就来说道说道虚拟背景的.转载 2021-08-04 09:53:05 · 2979 阅读 · 1 评论 -
“PGU-net+: Progressive Growing of U-net+ for Automated Cervical Nuclei Segmentation“ in MICCAI2019
Progressive Growing of U-net+ for Automated Cervical Nuclei Segmentation" in MICCAI2019 workshop MMMI.Paper link:http://arxiv.org/abs/1911.01062Please cite this paper if you find this project helpful for your research.Dependenciespython 3.7, CUDA ...原创 2021-07-17 11:02:15 · 199 阅读 · 0 评论 -
皱巴巴的文件?深度学习在文档图像形变矫正的应用
OCR作为智能审核的重要环节,其识别准确率影响着最终审核效果的好坏,而来自扫描仪、智能手机的文档图像多存在卷曲、折叠。本文旨在利用深度学习算法对文档图像的形变进行矫正,从而提高OCR识别效果,为智能审核保驾护航。一、背景随着集团业务的高速发展以及集团对用户群体信用要求的提高,证件审核成为业务中必不可少的一个环节。譬如:支付宝需要对用户的身份证信息进行审核,1688需要对卖家的营业执照进行审核。此外,还有一些业务涉及的是需要专业人士才有足够能力进行审核的信用证和保单。近年来,人工智能在越来越多的任转载 2021-06-28 21:17:49 · 2223 阅读 · 0 评论 -
一种keras改进的遥感图像语义分割的实现(末尾附代码)
Deep Residual U-Net (ResUNet)Paper:https://arxiv.org/pdf/1711.10684.pdfResUNet, a semantic segmentation model inspired by the deep residual learning and UNet. An architecture that take advantages from both(Residual and UNet) models.1.1 AdvantagesT.原创 2021-06-27 16:56:41 · 626 阅读 · 1 评论