自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(87)
  • 收藏
  • 关注

原创 NADAR: Neural Architecture Dilation for Adversarial Robustness

在过去的几十年里,卷积神经网络(CNN)在架构和规模上取得了巨大的进步,在某些任务中,它们可以很容易地达到甚至超过人类的表现。然而,最近发现CNN的一个缺点是容易受到对抗性攻击。虽然CNN的对抗鲁棒性可以通过对抗训练来提高,但在标准精度和对抗鲁棒性之间存在权衡。从神经结构的角度,本文旨在提高具有满意精度的骨干CNN的对抗鲁棒性。在最小的计算开销下,扩展架构的引入有望与骨干CNN的标准性能友好,同时追求对抗性的鲁棒性。

2024-08-22 19:43:31 523

原创 Anti-Bandit Neural Architecture Search for Model Defense

深度卷积神经网络(DCNNs)在机器学习中表现最好,但也可能受到对抗性攻击的挑战。在本文中,我们使用基于去噪块、无权重操作、Gabor滤波器和卷积的综合搜索的神经结构搜索(NAS)来防御对抗性攻击。由此产生的Anti-BanditNAS (ABanditNAS)包含了一种新的基于上下置信限(LCB和UCB)的作战评价度量和搜索过程。与仅使用UCB进行评估的传统强盗算法不同,我们使用UCB来abandon arms以提高搜索效率,使用LCB来实现武器之间的公平竞争。

2024-08-19 21:38:42 639

原创 FreeU: Free Lunch in Diffusion U-Net

在本文中,我们揭示了扩散U-Net尚未开发的潜力,它可以作为“免费午餐”,在运行中大幅提高生成质量。我们首先研究了U-Net架构对去噪过程的关键贡献,并确定其主要backbone主要有助于去噪,而其跳跃连接主要将高频特征引入解码器模块,导致网络忽略backbone语义。利用这一发现,我们提出了一种简单而有效的方法-称为“FreeU”-无需额外的培训或微调即可提高生成质量。我们的关键见解是战略性地重新权衡来自U-Net的跳跃连接和backbone特征映射的贡献,以利用U-Net架构的两个组件的优势。

2024-07-22 19:06:57 779

原创 CrossKD: Cross-Head Knowledge Distillation for Dense Object Detection

知识蒸馏(Knowledge Distillation, KD)是一种有效的学习紧凑目标检测器的模型压缩技术。现有最先进的KD检测方法大多基于特征模仿。在本文中,我们提出了一种通用且有效的预测模拟蒸馏方案,称为CrossKD,它将学生检测头的中间特征传递给教师检测头。由此产生的十字预测,然后被迫模仿老师的预测。这种方式使学生头从注释和老师的预测中接收到相互矛盾的监督信号,大大提高了学生的检测性能。此外,由于模仿老师的预测是KD的目标,与特征模仿相比,CrossKD提供了更多面向任务的信息。

2024-07-18 20:56:03 1166

原创 PKD: General Distillation Framework for Object Detectors via Pearson Correlation Coefficient

知识蒸馏(Knowledge distillation, KD)是一种广泛应用于目标检测的训练紧凑模型的技术。然而,对于如何在异构检测器之间进行蒸馏,目前还缺乏相关的研究。在本文中,我们经验地发现来自异构教师检测器的更好的FPN特征可以帮助学生,尽管他们的检测头和标签分配是不同的。然而,直接将特征映射与蒸馏检测器对齐存在两个问题。首先,教师和学生之间特征大小的差异可能会对学生施加过于严格的约束。

2024-07-18 20:38:18 904

原创 Visible and Clear: Finding Tiny Objects in Difference Map

微小目标检测是目标检测领域的关键问题之一。大多数通用检测器的性能在微小目标检测任务中显著下降。主要的挑战在于如何提取微小物体的有效特征。现有的方法通常是基于生成的特征增强,这种方法受到虚假纹理和伪影的严重影响,难以使微小物体的特征清晰可见,便于检测。为了解决这一问题,我们提出了一种自重构微小目标检测(SR-TOD)框架。我们首次在检测模型中引入了自重构机制,并发现了自重构机制与微小目标之间的强相关性。具体地说,我们在检测器的颈部之间施加一个重建头,构建重建图像与输入的差分图,显示出对微小物体的高灵敏度。

2024-07-17 17:05:36 567

原创 Deep Filtered Back Projection for CT Reconstruction

滤波反投影(FBP)是一种经典的计算机断层扫描(CT)重建解析算法,具有很高的计算效率。然而,用FBP重建的图像往往存在过多的噪声和伪影。原始的FBP算法使用窗函数平滑信号,并使用线性插值来估计非采样位置的投影值。在本研究中,我们提出了一个名为DeepFBP的新框架,其中通过神经网络学习优化的滤波器和优化的非线性插值算子。具体来说,学习到的滤波器可以看作是优化后的窗函数与斜坡滤波器的乘积,学习到的插值可以看作是通过非线性组合来优化利用附近位置投影信息的一种方法。

2024-07-06 17:58:37 368

原创 Towards Accurate and Robust Architectures via Neural Architecture Search

为了保护深度神经网络免受对抗性攻击,对抗性训练因其有效性而受到越来越多的关注。然而,对抗训练的准确性和鲁棒性受到体系结构的限制,因为对抗训练通过调整隶属于体系结构的权重连接来提高准确性和鲁棒性。在这项工作中,我们提出了ARNAS来搜索对抗训练的准确和健壮的架构。首先,我们设计了一个准确和鲁棒的搜索空间,其中单元格的位置和滤波器数量的比例关系是仔细确定的。通过将准确的结构和鲁棒的结构分别部署到敏感位置,使结构既具有精度又具有鲁棒性。

2024-07-06 17:49:54 743

原创 FOURIER NEURAL OPERATOR FOR PARAMETRIC PARTIAL DIFFERENTIAL EQUATIONS

神经网络的经典发展主要集中在有限维欧几里得空间之间的学习映射。最近,这被推广到学习函数空间之间映射的神经算子。对于偏微分方程,神经算子直接学习从任意函数参数依赖到解的映射。因此,他们学习了整个偏微分方程家族,而不像经典方法只解一个方程实例。在这项工作中,我们通过直接在傅里叶空间中参数化积分核来制定一个新的神经算子,允许一个表达和高效的架构。我们对Burgers方程、Darcy流和Navier-Stokes方程进行了实验。傅里叶神经算子是第一个成功模拟zero-shot超分辨率湍流的基于ML的方法。

2024-05-22 17:29:19 911

原创 Fast deep learning based reconstruction for limited angle tomography

计算机断层扫描的一个主要挑战是从不完整的数据中重建物体。对于这些问题,一个日益流行的解决方案是将深度学习模型整合到重建算法中。本文介绍了一种将傅里叶神经算子(FNO)集成到滤波后反投影(FBP)重建方法中的新方法,得到了FNO反投影(FNO-BP)网络。我们采用矩条件进行正弦图外推,以帮助模型从有限的数据中减轻伪影。值得注意的是,我们的深度学习架构保持了与经典滤波后投影(FBP)重建相当的运行时,确保了推理和训练期间的快速性能。

2024-05-20 19:00:56 848

原创 Revitalizing MLP’s Ability to Efficiently Extract Long-Distance Dependencies for Medical Image

基于深度学习网络的医学图像分割方法主要分为CNN和Transformer。然而,CNN很难捕获长距离依赖关系,而Transformer的计算复杂度高,局部特征学习能力差。为了有效地提取和融合局部特征和远程依赖关系,本文提出了一种结合MLP的CNN模型Rolling-Unet。具体来说,我们提出了核心R-MLP模块,该模块负责学习整个图像在单一方向上的长距离依赖关系。通过对不同方向的R-MLP模块进行控制和组合,形成OR-MLP和DOR-MLP模块,以捕获多方向的远程依赖关系。

2024-05-08 18:24:46 1046

原创 KAN: Kolmogorov–Arnold Networks

论文链接:https://arxiv.org/abs/2404.19756代码链接:https://github.com/KindXiaoming/pyKAN项目链接:https://kindxiaoming.github.io/pyKAN/intro.html受Kolmogorov-Arnold表示定理的启发,我们提出Kolmogorov-Arnold网络(KAN)作为多层感知器(MLP)的有前途的替代品。MLP在节点(“神经元”)上有固定的激活函数,而KAN在边缘(“权重”)上有可学习的激活函数。KAN

2024-05-07 19:17:17 2236

原创 KAN:Kolmogorov–Arnold Networks

受Kolmogorov-Arnold表示定理的启发,我们提出Kolmogorov-Arnold网络(KAN)作为多层感知器(MLP)的有前途的替代品。MLP在节点(“神经元”)上有固定的激活函数,而KAN在边缘(“权重”)上有可学习的激活函数。kan根本没有线性权重——每个权重参数都被参数化为样条的单变量函数所取代。我们表明,这个看似简单的改变使得KAN在准确性和可解释性方面优于MLP。就准确性而言,在数据拟合和PDE求解方面,更小的KAN可以达到与更大的MLP相当或更好的准确性。

2024-05-06 21:05:43 2822

原创 Linking In-plane and Through-plane Transformers for Simultaneous CT Image Denoising and Deblurring

本文研究了三维低剂量计算机断层扫描成像技术。尽管在此背景下开发了各种深度学习方法,但它们通常侧重于2D图像,并分别执行低剂量去噪和超分辨率去模糊。同时进行平面内去噪和透平面去模糊是获得低辐射、高成像速度的高质量三维CT图像的重要手段,但目前研究较少。对于这项任务,一个简单的方法是直接训练一个端到端的3D网络。然而,它需要更多的训练数据和昂贵的计算成本。

2024-04-30 20:52:20 795 2

原创 UNeXt: a Low-Dose CT denoising UNet model with the modified ConvNeXt block

近几十年来,临床医生广泛使用计算机断层扫描(CT)进行医学诊断。医疗辐射有潜在危险,因此需要减少CT扫描中的射线辐射。然而,辐射剂量的减少会导致噪声和伪影的增加。本文采用基于UNet的卷积神经网络(CNN)新架构对低剂量CT图像(LDCT)进行去噪,并与正常剂量图像(NDCT)进行对比。多特征提取块(multi-feature extraction block,MFEB)在不同的接受域中获取额外的特征。提出了改进的CT图像ConvNeXt块(CTNeXt),用于提取不同尺度的不同特征数据。

2024-04-30 20:44:26 1338 2

原创 DARTS-PT: RETHINKING ARCHITECTURE SELECTION IN DIFFERENTIABLE NAS

可微架构搜索(Differentiable Neural Architecture Search, NAS)是目前最流行的网络架构搜索(Neural Architecture Search, NAS)方法之一,它通过基于梯度的算法在权值共享的网络中共同优化模型权值和结构参数。在搜索阶段结束时,将选择具有最大架构参数的操作构成最终架构,并隐含假设架构参数的值反映了操作强度。虽然关于超网络优化的讨论很多,但架构选择过程却很少受到关注。

2024-03-29 20:33:57 1113

原创 UNDERSTANDING AND ROBUSTIFYING DIFFERENTIABLE ARCHITECTURE SEARCH

可微架构搜索(DARTS)由于其简单和小的搜索成本而引起了人们的广泛关注,该搜索成本是通过连续松弛和近似产生的双层优化问题来实现的。然而,对于新问题,DARTS并不能健壮地工作:我们确定了一个广泛的搜索空间,其中DARTS产生了退化的架构,测试性能非常差。我们研究了这种失效模式,并表明,虽然成功地最小化了验证损失,但当它们与架构空间中的高验证损失曲率相吻合时,所找到的解泛化性很差。我们证明了通过添加各种类型的正则化中的一种,我们可以鲁棒化DARTS以找到曲率更小和泛化性能更好的解。

2024-03-28 21:06:55 1086

原创 DARTS-: ROBUSTLY STEPPING OUT OF PERFORMANCE COLLAPSE WITHOUT INDICATORS

可微体系结构搜索(DARTS)发展迅速,但长期存在性能不稳定的问题,极大地限制了其应用。现有的鲁棒方法从导致的恶化行为中寻找线索,而不是找出其原因。在性能崩溃之前,提出了各种指标如Hessian特征值作为停止搜索的信号。然而,如果阈值设置不当,这些基于指标的方法往往容易拒绝良好的体系结构,更不用说搜索本质上是有噪声的。在本文中,我们采取一种更微妙和直接的方法来解决崩溃。我们首先证明跳跃连接比其他候选操作有明显的优势,它可以很容易地从不利状态恢复并成为主导。我们推测这种特权会导致性能下降。

2024-03-25 20:09:20 943

原创 FairDARTS: Eliminating Unfair Advantages in Differentiable Architecture Search

可微分架构搜索(DARTS)是目前广泛应用的一种权重共享神经架构搜索方法。然而,由于不可避免的跳跃连接聚合,它遭受了众所周知的性能崩溃。本文首先揭示了其根源在于排他性竞争中的不公平优势。通过实验,我们证明,如果两个条件中的任何一个被打破,崩溃就会消失。因此,我们提出了一种新的方法,称为FairDARTS,其中排他性竞争被放松为协作。具体来说,我们让每个操作的体系架构权重独立于其他操作。然而,离散化差异仍然是一个重要的问题。

2024-03-21 21:27:46 710

原创 DARTS+: Improved Differentiable Architecture Search with Early Stopping

最近,人们对神经架构设计过程的自动化越来越感兴趣,而可微分架构搜索(DARTS)方法使该过程在几个GPU天内可用。然而,当搜索epoch数变大时,通常会观察到DARTS的性能崩溃。同时,在所选的体系结构中发现了大量的“跳跃连接”。在本文中,我们认为崩溃的原因是在优化中存在过拟合。因此,我们提出了一种简单有效的算法,命名为“DARTS+”,通过在满足一定条件时“早停”搜索过程来避免崩溃并改进原有的DARTS。

2024-03-18 19:56:21 935

原创 PC-DARTS: PARTIAL CHANNEL CONNECTIONS FOR MEMORY-EFFICIENT ARCHITECTURE SEARCH

可微分体系结构搜索(DARTS)在寻找有效的网络体系结构方面提供了一种快速的解决方案,但在联合训练超网络和搜索最优体系结构时存在较大的内存和计算开销。在本文中,我们提出了一种新颖的方法,即部分连接的DARTS,通过对超网络的一小部分采样来减少探索网络空间时的冗余,从而在不影响性能的情况下执行更有效的搜索。特别是,我们在通道的子集中执行操作搜索,而在快捷方式中绕过保留部分。这种策略可能会由于采样不同的通道而导致超网络边缘选择不一致。

2024-03-16 19:06:23 821

原创 Progressive Differentiable Architecture Search: Bridging the Depth Gap between Search and Evaluation

近年来,可微搜索方法在降低神经结构搜索的计算成本方面取得了重大进展。然而,这些方法在评估搜索的体系结构或将其转移到另一个数据集时往往展示较低的准确性。这是由于搜索和评估场景中架构深度之间的巨大差距。在本文中,我们提出了一种有效的算法,该算法允许在训练过程中搜索结构的深度逐渐增长。这带来了两个问题,即更大的计算开销和更弱的搜索稳定性,我们分别使用搜索空间近似和正则化来解决这两个问题。

2024-03-16 17:02:38 628

原创 DARTS: DIFFERENTIABLE ARCHITECTURE SEARCH

本文通过以可微分的方式表述任务,解决了架构搜索的可扩展性挑战。与在离散和不可微搜索空间上应用进化或强化学习的传统方法不同,我们的方法基于架构表示的连续松弛,允许使用梯度下降对架构进行有效搜索。在CIFAR-10、ImageNet、Penn Treebank和WikiText-2上进行的大量实验表明,我们的算法在发现用于图像分类的高性能卷积架构和用于语言建模的循环架构方面表现出色,同时比最先进的不可微技术快几个数量级。我们的实现已经公开,以促进对高效架构搜索算法的进一步研究。

2024-03-12 20:57:11 901

原创 VM-UNet: Vision Mamba UNet for Medical Image Segmentation

在医学图像分割领域,基于CNN和基于Transformer的模型都得到了广泛的探索。然而,CNN在远程建模能力方面表现出局限性,而Transformer则受到二次计算复杂性的阻碍。最近,以Mamba为例的状态空间模型(SSM)作为一种很有前途的方法出现了。它们不仅在远程相互作用建模方面表现优异,而且保持了线性计算复杂度。本文利用状态空间模型,提出了一种用于医学图像分割的U-shaped架构模型,命名为视觉Mamba UNet (VM-UNet)。

2024-02-23 19:56:49 2951

原创 VVBP-Tensor in the FBP Algorithm: Its Properties and Application in Low-Dose CT Reconstruction

几十年来,商用X射线计算机断层扫描(CT)扫描仪一直使用滤波反投影(FBP)算法进行图像重建。然而,对低辐射剂量的渴望已经将FBP算法推向了极限。以往的研究通过对正弦图进行预处理、修改斜坡滤波器或对重建图像进行后处理来改善FBP的结果。本文主要对FBP算法中逐视图反向投影(VVBP-Tensor)进行分析和处理。我们分析的一个关键挑战在于每个反向投影切片的径向结构。为了克服这个困难,在VVBP-Tensor的z方向(投影视图的方向)引入了一个排序操作。

2024-01-30 14:19:42 927

原创 VMamba: Visual State Space Model

卷积神经网络(CNN)和视觉Transformer(ViT)是视觉表征学习中最流行的两种基础模型。CNN在线性复杂度和图像分辨率方面表现出显著的可扩展性,而ViT在拟合能力方面超越了CNN,尽管它要与二次复杂度竞争。通过对全局感受野和动态权重的结合,ViT实现了卓越的视觉建模性能。这一观察结果促使我们提出一种新的架构,该架构继承了这些组件,同时提高了计算效率。为此,我们从最近引入的状态空间模型中汲取灵感,提出了在不牺牲全局感受野的情况下实现线性复杂性的视觉状态空间模型(VMamba)。

2024-01-28 15:21:51 1888

原创 A ConvNet for the 2020s

视觉识别的“咆哮的20年代”始于视觉Transformer(ViT)的引入,它很快取代了卷积神经网络,成为最先进的图像分类模型。另一方面,vanilla ViT在应用于一般的计算机视觉任务(如对象检测和语义分割)时面临困难。分层Transformer(例如,Swin Transformer)重新引入了几个卷积神经网络先验,使Transformer作为通用视觉主干实际上可行,并在各种视觉任务上表现出卓越的性能。

2024-01-15 17:27:44 910

原创 AUTO SEG-LOSS SEARCHING METRIC SURROGATES FOR SEMANTIC SEGMENTATION

设计合适的损失函数是训练深度网络的关键。特别是在语义分割领域,针对不同的场景提出了不同的评价指标。尽管广泛采用的交叉熵损失及其变体取得了成功,但损失函数和评估指标之间的不一致会降低网络性能。同时,手动设计每个特定度量的损失函数需要专业知识和大量人力。在本文中,我们提出通过搜索每个度量的可微代理损失来自动设计度量特定的损失函数。我们用参数化函数代替度量中的不可微操作,并进行参数搜索以优化损失曲面的形状。引入两个约束来正则化搜索空间,提高搜索效率。

2024-01-12 19:50:16 1055

原创 Priors in Deep Image Restoration and Enhancement: A Survey

图像恢复和增强是通过消除诸如噪声、模糊和分辨率退化等退化来提高图像质量的过程。深度学习(DL)最近被应用于图像恢复和增强。由于深度神经网络的病态性,人们已经探索了大量的先验知识来促进深度神经网络的训练。然而,到目前为止,学界还没有对先验的重要性进行系统的研究和分析。因此,本文首次对先验算法在深度图像恢复和增强方面的最新进展进行了全面的综述。

2024-01-07 20:12:10 1364

原创 Fast and flexible X-ray tomography using the ASTRA toolbox

从一系列投影图像中重建物体,如在计算机断层扫描(CT)中,是许多不同应用领域的流行工具。现有的商业软件通常为最终用户提供足够精确和方便使用的重建工具。然而,在使用非标准采集协议或需要高级重建方法的应用中,标准软件工具通常无法计算准确的重建图像。本文介绍ASTRA工具箱。ASTRA工具箱针对多个层析成像应用领域的研究人员,为层析成像投影和重建提供了一套高效、高度灵活的开源工具。讨论了ASTRA工具箱的主要功能,并给出了几个用例。

2024-01-04 20:01:56 1453

原创 The ASTRA Toolbox: A platform for advanced algorithm development in electron tomography

我们提出ASTRA工具箱作为一个开放的平台,用于断层扫描中的三维图像重建。目前在电子断层扫描中使用的大多数软件工具在获取模型的几何参数和用于重建的算法方面提供有限的灵活性。ASTRA工具箱提供了一套广泛的快速灵活的构建模块,可用于开发高级重建算法,有效地消除了这些限制。我们通过一系列基于实验双轴倾斜序列的实验证明了这种灵活性,由此产生的重建质量和该工具箱的计算效率。

2023-12-26 19:06:36 1347

原创 Weighted Filtered Back-Projection for Source Translation Computed Tomography Reconstruction

微计算机断层扫描(micro-CT)是科学研究中提供基于衰减的高分辨率三维图像不可或缺的工具。然而,它目前可用的配置限制了可以成像的对象的大小。在此之前,我们提出了一种多源平移计算机断层扫描(mSTCT)成像几何来扩展micro-CT的视场(FOV),并开发了一种相应的重建算法,称为基于虚拟投影的滤波反投影(V-FBP)。当源被密集采样时,V-FBP实现高分辨率重建,但如果源被粗采样则失败。在本文中,为了在低源采样率下实现高分辨率重建,我们提出了一种全扫描多重STCT (F-mSTCT)扫描配置。

2023-12-19 15:27:25 882

原创 Arbitrarily large iterative tomographic reconstruction on multiple GPUs using the TIGRE toolbox

随着时间的推移,层析图像的大小一直在增加,而计算层析重建的GPU的内存大小也在增加,但它们的速度不够快,无法重建最大的数据集。这个问题通常是通过在大量GPU集群中重建数据来解决的,这些GPU集群中有足够的设备来适应测量的x射线投影和重建的体素。这通常需要数十个GPU,这是一个非常经济昂贵的解决方案。在该领域,使用设计用于仅使用一个或几个GPU进行重建的单节点机器更为常见,但目前的软件不允许迭代重建不适合这些GPU的体素。

2023-12-13 19:40:43 892

原创 TIGRE: a MATLAB-GPU toolbox for CBCT image reconstruction

本文介绍了基于层析迭代GPU的重建(TIGRE)工具箱,这是一个用于快速准确重建3D X射线图像的MATLAB/ CUDA工具箱。其中一个关键特征是实现了各种各样的迭代算法和FDK,包括SART族中的一系列算法,Krylov子空间族和使用全变分正则化的一系列方法。此外,该工具箱具有GPU加速投影和使用最新技术的反投影,并且它具有模块化设计,便于新算法的实现。我们概述了创建工具箱时使用的结构和技术,并提供了两个使用示例。TIGRE工具箱是在开源许可下发布的,鼓励人们做出贡献。

2023-12-13 15:20:53 2211

原创 ISNAS-DIP: Image-Specific Neural Architecture Search for Deep Image Prior

最近的研究表明,卷积神经网络(CNN)架构在频谱上偏向较低频率,这已被用于深度图像先验(DIP)框架中的各种图像恢复任务。网络在DIP框架中施加的感应偏置的好处取决于体系结构。因此,研究人员研究了如何自动搜索以确定最佳表现模型。然而,常用的神经结构搜索(NAS)技术是资源和时间密集型的。此外,最佳表现的模型是为整个图像数据集确定的,而不是单独为每个图像确定的,这将是非常昂贵的。在这项工作中,我们首先证明了DIP框架中的最优神经结构是图像相关的。

2023-12-06 11:33:39 1493

原创 Neural Architecture Search for Deep Image Prior

在最近提出的深度图像先验算法(DIP)下,我们提出了一种神经结构搜索(NAS)技术来提高无监督图像去噪、修复和超分辨率的性能。我们发现,进化搜索可以自动优化DIP网络的编码器-解码器(E-D)结构和元参数,这是在正则化这些单个图像恢复任务之前的特定内容。我们的二进制表示对非对称E-D网络的设计空间进行编码,该网络通常在10-20代内收敛,使用500个种群大小产生特定于内容的DIP。优化的架构不断提高经典DIP的视觉质量,以满足各种摄影和艺术内容。

2023-11-29 15:37:47 1419

原创 Deep Image Prior

深度卷积网络已经成为一种流行的图像生成和恢复工具。一般来说,它们的优异表现归功于它们能够从大量的示例图像中学习真实的图像先验。在本文中,我们表明,相反,生成器网络的结构足以在任何学习之前捕获大量低级图像统计。为了做到这一点,我们表明随机初始化的神经网络可以用作手工制作的先验,在标准逆问题(如去噪,超分辨率和修复)中具有出色的结果。此外,可以使用相同的先验来反演深度神经表征以诊断它们,并基于flash-no flash输入对恢复图像。除了其多样化的应用之外,我们的方法还突出了标准生成网络架构捕获的感应偏置。

2023-11-28 20:17:30 1047

原创 NAS-DIP: Learning Deep Image Prior with Neural Architecture Search

最近的研究表明,深度卷积神经网络的结构可以用作解决各种逆图像恢复任务的结构化图像先验。我们建议寻找能够捕获更强图像先验的神经结构,而不是使用手工设计的结构。在通用U-Net架构的基础上,我们的核心贡献在于为(1)上采样单元和(2)跨尺度残差连接模式设计新的搜索空间。我们通过利用现有的神经结构搜索算法(使用带有循环神经网络控制器的强化学习)来搜索改进的网络。我们通过各种各样的应用验证了我们方法的有效性,包括图像恢复、去雾、图像到图像的翻译和矩阵分解。

2023-11-27 19:17:44 1047

原创 Parallel Diffusion Models of Operator and Image for Blind Inverse Problems

在正向算子已知的情况下(即非盲),基于扩散模型的逆问题求解器已经展示了最先进的性能。然而,该方法对盲逆问题的适用性还有待探索。 在这项工作中,我们证明我们确实可以通过为前向算子构造另一个扩散先验来解决一系列盲逆问题。具体来说,在中间阶段梯度引导下的平行反向扩散可以同时优化正演算子参数和图像,从而在平行反向扩散过程结束时对两者进行联合估计。我们展示了我们

2023-11-21 17:32:37 306

原创 OSCNet: Orientation-Shared Convolutional Network for CT Metal Artifact Learning

X射线计算机断层扫描(CT)已广泛应用于疾病诊断和图像引导干预的临床应用。然而,患者体内的金属总是在恢复的CT图像中造成不利的伪影。尽管在金属伪影还原(MAR)任务中获得了有希望的重建结果,但大多数现有的基于深度学习的方法都存在一些局限性。关键的问题是,这些方法中的大多数都没有充分利用这个特定MAR任务背后的重要

2023-11-14 18:00:48 362

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除