论文笔记
文章平均质量分 87
来自γ星的赛亚人
来自γ星球的外星人,大家可以向我提问外星知识,
大洪水是真实存在的哦
展开
-
【论文笔记】SINE: SINgle Image Editing with Text-to-Image Diffusion Models
最近的扩散模型研究展示了在生成图像中进行条件控制的强大能力,例如文本引导图像合成。这种成功激励了许多尝试使用大规模预训练扩散模型解决一个具有挑战性的问题 - 实际图像编辑。在这个领域进行的工作学习了一个唯一的文本标记,对应于包含相同对象的几个图像。然而,在许多情况下,只有一张图像可用,例如"戴珍珠耳环的女孩"的画作。使用现有的关于对单个图像进行微调的工作会导致严重的过拟合问题。预训练扩散模型中的信息泄漏使得编辑无法保持与给定图像相同的内容,同时又能根据语言引导创建新的特征。本文旨在解决单图像编辑的问题。原创 2023-07-14 22:13:29 · 1317 阅读 · 0 评论 -
【论文笔记】Deep High-Resolution Representation Learning for Human Pose Estimation
在本文中,作者对人类姿势估计问题感兴趣,重点是学习可靠的高分辨率表示。大多数现有方法从高到低分辨率网络产生的低分辨率表示中恢复高分辨率表示。相反,作者建议的网络在整个过程中保持高分辨率表示。我们从高分辨率子网作为第一阶段开始,逐步逐个添加高到低分辨率子网,形成更多的阶段,并并行连接多分辨率子网。进行重复的多尺度融合,以使每个高到低分辨率表示一次又一次地从其他并行表示接收信息,从而产生丰富的高分辨率表示。结果,预测的关键点热图可能更准确,并且在空间上更精确。原创 2022-11-04 11:38:57 · 507 阅读 · 1 评论 -
【论文笔记】An Image Patch is a Wave: Phase-Aware Vision MLP
在计算机视觉领域,最近的工作表明,主要由全连接层堆叠的纯 MLP 架构可以实现与 CNN 和 Transformer 竞争的性能。视觉 MLP 的输入图像通常被拆分为多个令牌(补丁),而现有的 MLP 模型直接将它们以固定的权重聚合,忽略了来自不同图像的令牌的不同语义信息。为了动态聚合令牌,我们建议将每个令牌表示为具有振幅和相位两部分的波函数。幅度是原始特征,相位项是根据输入图像的语义内容而变化的复数值。引入相位项可以动态调节 MLP 中令牌和固定权重之间的关系。原创 2022-09-25 18:32:48 · 1328 阅读 · 1 评论 -
【论文笔记】Enabling technologies and tools for digital twin
数字孪生正在革新工业。由传感器更新和历史数据激发,复杂的模型可以反映产品、过程或服务的几乎每个方面。未来,物理世界中的一切都将通过数字孪生技术在数字空间中复制。作为一项前沿技术,数字孪生受到了很多关注。然而,数字孪生远未实现其潜力,这是一个复杂的系统和漫长的过程。研究人员必须对物体或系统的所有独立部分进行建模。需要收集和合并各种类型的数据。许多工程研究人员和参与者不清楚应该使用哪些技术和工具。5维数字孪生模型为理解和实施数字孪生提供了参考指导。原创 2022-09-05 20:54:59 · 1139 阅读 · 0 评论 -
【论文笔记】Moire Photo Restoration Using Multiresolution ´Convolutional Neural Networks
数码相机和手机使我们能够方便地记录珍贵的时刻。虽然数字图像质量不断提高,但拍摄高质量的数字屏幕照片仍然具有挑战性,因为照片经常被莫尔条纹污染,这是相机传感器像素网格和设备屏幕之间干扰的结果。摩尔纹图案会严重损害照片的视觉质量。然而,很少有研究旨在解决这个问题。在本文中,我们介绍了一种新颖的多分辨率全卷积网络,用于从照片中自动去除莫尔条纹。由于莫尔条纹跨越很宽的频率范围,我们提出的网络在计算如何消除每个频带内的莫尔条纹伪影之前对输入图像执行非线性多分辨率分析。原创 2022-09-03 21:18:56 · 227 阅读 · 0 评论 -
【论文笔记】IEEE | 一种新卷积 DSConv: Efficient Convolution Operator
我们引入了一种称为 DSConv(分布移位卷积)的卷积层变体,它可以很容易地替换到标准神经网络架构中,并实现更低的内存使用和更高的计算速度。DSConv 将传统的卷积核分解为两个组件:可变量化核 (VQK) 和分布偏移。通过在 VQK 中仅存储整数值来实现更低的内存使用和更高的速度,同时通过应用基于内核和通道的分布偏移来保留与原始卷积相同的输出。我们在 ResNet50 和 ResNet34 以及 AlexNet 和 MobileNet 上测试 ImageNet 中的 DSConv。...原创 2022-08-30 15:32:49 · 5335 阅读 · 2 评论 -
【论文笔记】MiniSeg: An Extremely Minimum Network for Efficient COVID-19 Segmentation
提出了 MiniSeg,一种用于高效 COVID-19 分割的轻量级深度学习模型。原创 2022-07-26 22:53:49 · 1501 阅读 · 0 评论 -
【论文笔记】TransUNet: Transformers Make StrongEncoders for Medical Image Segmentation
Transformer 为医学图像分割提供强大的编码器原创 2022-07-03 19:23:02 · 1276 阅读 · 0 评论 -
基于计算机视觉任务的人工智能 covid-19 肺部感染区域成像模型的回顾与分类
本文系统概述了使用计算机断层扫描 (CT) 医学图像诊断 2019 年冠状病毒病 (COVID-19) 的人工智能 (AI) 和计算机视觉策略原创 2022-05-28 18:13:36 · 364 阅读 · 0 评论 -
DMDF-Net:双多尺度扩展融合网络,用于covid-19肺部病变区域的精确分割
我们提出了一种双多尺度扩张融合网络 (DMDF-Net),用于对给定 CT 图像中的小病灶进行稳健分割。所提出的网络主要利用编码器和解码器模块内部多尺度深度特征融合的优势,以互惠互利的方式实现卓越的分割性能。在所提出的方法中引入了额外的预处理和后处理步骤,以解决普遍性问题并进一步提高诊断性能。主要是在后处理步骤中引入后感兴趣区域(ROI)融合的概念,减少了假阳性的数量,并提供了一种准确量化肺部感染区域的方法。原创 2022-05-27 11:40:39 · 590 阅读 · 0 评论 -
TV-Unet:使用连接施加的 U-net 分割 covid-19 肺部感染区域 CT 图像
提出了一个分割框架来检测 CT 图像中被 COVID-19 感染的胸部区域。采用类似于 U-net 模型的架构来检测体素级别的毛玻璃区域。由于受感染区域倾向于形成连接的组件(而不是随机分布的体素),因此开发了基于 2D 各向异性总变化的合适正则化项并将其添加到损失函数中。因此,所提出的模型被称为“ TV-Unet ”...原创 2022-05-25 17:09:20 · 1060 阅读 · 0 评论 -
SSA-Net:基于半监督小样本学习的 covid-19 肺部感染区域分割的空间自我注意网络
提出了一种新型新型冠状病毒肺炎肺炎病变分割网络,称为空间自我注意网络 (SSA-Net),用于从胸部CT图像中自动识别感染区域。在我们的SSA-Net中,利用自我注意机制通过从更深层提取有用的上下文信息而无需额外的训练时间来扩展接受领域并增强表示学习,并引入空间卷积以增强网络并加速训练收敛。原创 2022-05-17 20:25:44 · 1536 阅读 · 0 评论 -
基于 DenseNet 和 VGG16 特征融合的 covid-19 冠状病毒 X 射线图像分类与检测方法
提出了一种基于密集卷积网络(DenseNet)和视觉几何组网络(VGG16)特征融合的胸部X光图像分类方法。 本文在模型中加入了注意力机制(全局注意力机器块和类别注意力块)来提取深度特征。 残差网络(ResNet)用于分割有效的图像信息,以快速实现准确分类。 我们的模型检测二元分类的平均准确率可以达到 98.0%。 三类分类的平均准确率可以达到97.3%。原创 2022-05-17 19:17:50 · 1939 阅读 · 3 评论 -
【论文笔记】Dense GAN and multi-layer attention based lesion segmentation method for COVID-19 CT images
本文提出了一种改进的 Dense-GAN 扩展数据集,并结合 U-Net 的2019冠状病毒疾病肺 CT 图像分割,提出了一种多层注意机制方法。实验结果表明,与其他图像分割方法相比,本文提出的分割方法提高了 2019 冠状病毒疾病肺部医学 CT 图像的分割精度。原创 2022-05-16 17:51:23 · 489 阅读 · 0 评论 -
【论文笔记】MultiR-Net:一种新的 covid-19 肺部病变区域分割和分类的联合学习网络
最近,COVID-19 中的深度学习主要分为疾病分类和病灶分割,但很少有工作关注这两个任务之间的特征相关性。为了解决这些问题,在本研究中,我们提出了 MultiR-Net,这是一种用于组合 COVID-19 分类和病灶分割的 3D 深度学习模型,以实现实时和可解释的 COVID-19 胸部 CT 诊断。准确地说,所提出的网络由两个子网组成:一个用于病变分割的多尺度特征融合类 U-Net 子网和一个用于疾病诊断的分类子网。原创 2022-05-16 15:43:16 · 856 阅读 · 0 评论 -
【论文笔记】D2A U-Net: Automatic segmentation of COVID-19 CT slices based on dual attention and hybrid di
提出了一种基于双注意策略和混合扩张卷积的新型扩张双注意 U-Net,即D2A U-Net,用于 CT 切片2019 冠状病毒疾病病变的分割。在我们的 D2A U-Net中,由两个注意模块组成的双注意策略被用于细化特征图,并缩小不同层次特征图之间的语义差距。此外,在模型解码器中引入了混合扩张卷积,以获得更大的接收场,从而优化了解码过程。原创 2022-05-14 21:57:12 · 609 阅读 · 2 评论 -
【论文笔记】Multi-task deep learning based CT imaging analysis for COVID-19 pneumonia: Classification and
本文提出了一种自动分类分割工具,用于帮助使用胸部 CT 成像筛查 COVID-19 肺炎。分割的病灶有助于评估肺炎的严重程度和对患者的随访。在这项工作中,我们提出了一种新的多任务深度学习模型来联合识别 COVID-19 患者并从胸部 CT 图像中分割 COVID-19 病变。原创 2022-05-14 14:32:43 · 386 阅读 · 0 评论 -
【论文笔记】Contour-enhanced attention CNN for CT-based COVID-19 segmentation
提出了一个 Contour-aware Attention Decoder CNN,以一种非常有效的方式精确分割 COVID-19 感染的组织。它引入了一种新的注意方案来从 CT 轮廓中提取边界、形状线索,并利用这些特征来细化感染区域原创 2022-05-13 19:33:23 · 508 阅读 · 0 评论 -
【论文笔记】SCOAT-Net: A novel network for segmenting COVID-19 lung opacification from CT images
SCOAT网络:一种新的分割2019冠状病毒疾病肺的网络CT图像中的混浊原创 2022-05-12 20:48:30 · 638 阅读 · 1 评论 -
【covid-19】Inf-Net: Automatic COVID-19 Lung InfectionSegmentation from CT Images
一种新的 covid-19 肺部感染分割深度区域(Inf-Net)原创 2022-05-09 13:20:54 · 1150 阅读 · 0 评论 -
【论文笔记】covid-19肺部感染区域分割基准
声明不定期更新自己精度论文,通俗易懂,初级小白也可以理解涉及范围:深度学习方向,包括 CV、NLP、Data Fusion、Digital Twin原创 2022-05-06 19:52:21 · 1308 阅读 · 0 评论 -
【论文笔记】Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspectivewith Transformers
从序列到序列的学习角度重新定义了图像语义分割问题,为主导的编码器-解码器 FCN 模型设计提供了一种替代方案,即 SEgmentation TRansformer原创 2022-04-29 20:36:08 · 1609 阅读 · 0 评论 -
【论文笔记】Focal Self-attention for Local-Global Interactions inVision Transformers
Vision Transformer 中局部-全局互动的焦点自我关注原创 2022-04-28 16:51:08 · 2390 阅读 · 0 评论 -
【论文笔记】A Survey on Masked Facial Detection Methods and Datasets for Fighting Against COVID-19
对抗 COVID-19 的蒙面面部检测方法和数据集的调查原创 2022-04-24 21:46:37 · 1975 阅读 · 2 评论 -
【论文笔记】Vision Transformers for Dense Prediction
提出了基于 ViT 为主干架构的 Vision Transformer原创 2022-04-22 13:36:25 · 5325 阅读 · 0 评论 -
【论文标题】Bottleneck Transformers for Visual Recognition
提出了 BoTNet,这是一种概念上简单但功能强大的主干架构,它结合了用于多个计算机视觉任务的自注意力,包括图像分类、对象检测和实例分割。原创 2022-04-20 14:51:00 · 2217 阅读 · 0 评论 -
【论文精读】CMT: Convolutional Neural Networks MeetVision Transformers
CMT 架构一种新颖的 CMT(CNNs meet transformers)架构用于视觉识别论文标题:CMT: Convolutional Neural Networks MeetVision TransformersCMT:卷积神经网络与视觉变压器论文链接:https://arxiv.org/abs/2107.06263论文代码:发表时间:2021年7月Abstract视觉转换器已成功应用于图像识别任.原创 2022-04-18 18:05:15 · 5391 阅读 · 0 评论 -
【图像分割】Segmenter: Transformer for Semantic Segmentation
一种基于 Vision Transformer 的语义分割的新颖方法,该方法不使用卷积,通过设计捕获上下文信息并优于基于 FCN 的方法;原创 2022-04-11 20:43:30 · 3996 阅读 · 0 评论 -
【论文笔记】Segmenting Transparent Object in the Wild with Transformer
CNN + Transformer 的语义分割模型原创 2022-04-09 15:35:26 · 3437 阅读 · 0 评论 -
【论文笔记】DUDA‑Net: a double U‑shaped dilated attention network for automatic infection area segmentati
covid-19 的语义分割,分割病变肺部区域原创 2022-04-07 14:47:45 · 2506 阅读 · 0 评论 -
【论文笔记】A Survey of Visual Transformers(完结)
Vision Transformer 综述论文题目:A Survey of Visual Transformers论文链接:https://arxiv.org/abs/2111.06091发表时间:2021年11月AbstractTransformer是一种基于注意...原创 2022-04-04 22:29:29 · 3834 阅读 · 0 评论 -
【论文笔记】LeViT: a Vision Transformer in ConvNet’s Clothingfor Faster Inference
LeViT 应用了 ResNet 的 Vision Tramsformer原创 2022-04-03 19:45:40 · 2127 阅读 · 3 评论 -
【CNN+VIT】LocalViT: Bringing Locality to Vision Transformers
Local ViT 引入深度卷积的 Vision Transformer原创 2022-03-28 14:59:37 · 4918 阅读 · 0 评论 -
【ViT】Incorporating Convolution Designs into Visual Transformers
CeiT CNN + Transformer 架构原创 2022-03-27 16:42:37 · 3477 阅读 · 0 评论 -
【论文笔记】CvT: Introducing Convolutions to Vision Transformers
CNN + Transformer CVT架构原创 2022-03-26 14:52:21 · 5289 阅读 · 6 评论 -
【论文笔记】Conditional Positional Encodings for Vision Transformers
CNN+Transformer 解决了空间信息的问题原创 2022-03-25 20:11:08 · 4183 阅读 · 0 评论 -
【论文笔记】Multimodality in Meta-Learning: A Comprehensive Survey
元学习中的多模态任务原创 2022-03-24 17:09:14 · 984 阅读 · 0 评论 -
【论文笔记】ViLBERT:Pretraining Task-Agnostic VisiolinguisticRepresentations for Vision-and-Language Tasks
ViLBERT 统一多模态的新 BERT 预训练模型原创 2022-03-21 12:20:41 · 2583 阅读 · 0 评论 -
【论文笔记】用数字孪生改变农业食品生产系统和供应链
论文标题:Transforming agrifood production systems and supply chains with digital twins论文链接:https://arxiv.org/abs/2202.07455发表时间:2022年1月Abstract数字孪生可以改变农业生产系统和供应链,减少温室气体排放、食物浪费和营养不良。 然而,这些先进的虚拟化技术的潜力尚未实现。在这里,我们考虑了跨五个典型农产品供应链步骤的数字孪生的前景,并强调了关键的实施障碍Mai..原创 2022-03-10 16:38:24 · 3806 阅读 · 0 评论 -
【论文笔记】Vision Transformer for Small-Size Datasets
论文标题:Vision Transformer for Small-Size Datasets论文链接:https://arxiv.org/abs/2112.13492论文代码:https://github.com/aanna0701/SPT_LSA_ViT发表时间:2021年12月创新点由于 ViT 的高性能源于使用大数据集进行预训练,并且其对大型数据集的依赖被解释为由于低局部归纳偏差,因此本文提出 Shifted Patch Tokenization (SPT) 和Loca...原创 2022-03-09 12:28:03 · 3126 阅读 · 0 评论