- 博客(241)
- 资源 (13)
- 收藏
- 关注
原创 【图像拼接】源码精读:Parallax-Tolerant Unsupervised Deep Image Stitching(UDIS++)
注:Pytorch代码。【图像拼接论文精读】专栏对应文章【图像拼接】论文精读:Parallax-Tolerant Unsupervised Deep Image Stitching(UDIS++)配合对应的文章阅读,效果更佳!注:请重点关注代码段中的注释!!!有一些讲解的东西直接写在代码段的注释中了,同时多关注红色字体和绿色字体!!!我认为深度学习方法和传统方法有很多相似之处。比如:深度学习中的损失函数和传统方法中的对齐项、失真项等其实原理相同,只是求解方式不同。
2024-04-08 15:00:39 4616 24
原创 【图像超分】论文精读:Wide Activation for Efficient and Accurate Image Super-Resolution(WDSR)
在本文中,我们证明了在相同的参数和计算预算下,ReLU激活前具有更广泛特征的模型对于单图像超分辨率 (SISR) 具有显着更好的性能。生成的 SR 残差网络在每个残差块的激活之前具有更宽的 (2× 到 4 倍) 通道的小恒等映射路径。为了在不增加计算开销的情况下进一步扩大激活(6×到9×),我们在SR网络中引入线性低秩卷积,实现了更好的精度-效率权衡。此外,与批量归一化或没有归一化相比,我们发现使用权重归一化进行训练可以提高深度超分辨率网络的准确性。我们提出的SR网络WDSR在计算复杂度相同或更低的PSNR
2024-04-01 11:07:00 5749
原创 【图像拼接/扩散模型】论文精读:RecDiffusion: Rectangling for Image Stitching with Diffusion Models(重磅!CVPR 2024)
来自不同捕获的图像拼接通常会导致非矩形边界,这通常被认为是不吸引人的。为了解决非矩形边界,当前的解决方案涉及裁剪,它丢弃图像内容、修复,这可能会引入不相关的内容或扭曲,这可能会扭曲非线性特征并引入伪影。为了克服这些问题,我们引入了一种新的基于扩散的学习框架RecDiffusion用于图像拼接矩形化。该框架结合了运动扩散模型(MDM)来生成运动场,有效地将拼接图像的不规则边界过渡到几何校正的中间。然后是内容扩散模型(CDM)进行图像细节细化。值得注意的是,我们的采样过程利用加权图来识别CDM每次迭代过程中需要
2024-04-01 11:06:20 6445 2
原创 【图像超分】论文精读:Residual Dense Network for Image Super-Resolution(RDN)
一个非常深的卷积神经网络 (CNN) 最近在图像分类 (SR) 方面取得了巨大成功,并提供了分层特征。然而,大多数基于深度 CNN 的 SR 模型没有充分利用原始低分辨率 (LR) 图像中的层次特征,从而实现相对较低的性能。在本文中,我们提出了一种新的残差密集网络(RDN)来解决图像SR中的这个问题。我们充分利用所有卷积层的分层特征。具体来说,我们提出了残差密集块(RDB)通过密集连接的卷积层提取丰富的局部特征。RDB 进一步允许将前一个 RDB 的状态与当前 RDB 的所有层直接连接,从而产生连续的内存
2024-03-31 07:27:29 5877
原创 【图像超分】论文精读:Deep Laplacian Pyramid Networks for Fast and Accurate Super-Resolution(LapSRN)
卷积神经网络最近证明了单图像超分辨率的高质量重建。在本文中,我们提出了拉普拉斯金字塔超分辨率网络(LapSRN)来逐步重建高分辨率图像的子带残差。在每个金字塔级别,我们的模型以粗分辨率的特征图作为输入,预测高频残差,并使用转置卷积进行上采样到更精细的级别。我们的方法不需要双三次插值作为预处理步骤,从而大大降低了计算复杂度。我们使用稳健的 Charbonnier 损失函数使用深度监督训练所提出的 LapSRN,并实现高质量的重建。此外,我们的网络通过渐进式重建在一次前馈传递中生成多尺度预测,从而促进资源感知应
2024-03-31 07:27:00 5859
原创 【图像超分】论文精读:Image Super-Resolution Using Dense Skip Connections(SRDenseNet)
最近的研究表明,利用深度卷积神经网络可以显著提高单幅图像超分辨率方法的性能。在这项研究中,我们提出了一种新的单图像超分辨率方法,通过在非常深的网络中引入密集的跳跃连接。在所提出的网络中,每一层的特征图被传播到所有后续层,提供了一种有效的方法来结合低级特征和高级特征来提高重建性能。此外,网络中的密集跳跃连接使短路径可以直接从输出构建到每一层,缓解了非常深的网络的梯度消失问题。此外,将反卷积层集成到网络中以学习上采样滤波器并加速重建过程。此外,所提出的方法大大减少了参数的数量,提高了计算效率。
2024-03-30 11:08:11 5880
原创 【图像超分】论文精读:ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks
超分辨率生成对抗网络(SRGAN)[1]是一项开创性的工作,能够在单幅图像超分辨率过程中生成逼真的纹理。然而,幻觉细节往往伴随着令人不快的伪影。为了进一步提高视觉质量,我们深入研究了SRGAN的三个关键组件——网络架构、对抗性损失和感知损失,并改进它们中的每一个以获得增强的SRGAN (ESRGAN)。特别是,我们引入了无批归一化的残差密集块(RRDB)作为基本网络构建单元。此外,我们借鉴了相对论GAN[2]的思想,让鉴别器预测相对真实性而不是绝对值。
2024-03-30 11:07:12 5937
原创 【图像超分】论文精读:Fully 1 × 1 Convolutional Network for Lightweight Image Super-Resolution (SCNet)
深度模型在单图像超分辨率 (SISR) 任务上取得了显着过程,特别是具有大内核 (3 × 3 或更多) 的大型模型。然而,此类模型的大量计算足迹阻碍了它们在实时、资源受限的环境中部署。相反,1 × 1 卷积带来了可观的计算效率,但在聚合局部空间表示方面存在困难,这是 SISR 模型的基本能力。为了应对这种二分法,我们建议协调 3 ×3 和 1 × 1 内核的优点,并利用轻量级 SISR 任务的巨大潜力。具体来说,我们提出了一个简单而有效的全卷积网络,称为基于 Shift-Conv 的网络 (SCNet)。通
2024-03-29 09:08:34 5910
原创 【图像超分】论文精读:SRResNet/SRGAN
尽管使用更快更深的卷积神经网络在单幅图像超分辨率的准确性和速度方面取得了突破,但一个中心问题在很大程度上仍未解决:当我们在大型放大因子上超分辨率时,我们如何恢复更精细的纹理细节。基于优化的超分辨率方法的行为主要是由目标函数的选择驱动的。最近的工作主要集中在最小化均方重建误差上。生成的估计具有较高的峰值信噪比,但它们通常缺乏高频细节,并且在感知上不令人满意,因为它们无法匹配更高分辨率的保真度。在本文中,我们提出了SRGAN,一种用于图像超分辨率(SR)的生成对抗网络(GAN)。据我们所知,这是第一个能够为4×
2024-03-29 09:07:29 6021
原创 【图像超分】论文精读:CoSeR: Bridging Image and Language for Cognitive Super-Resolution(CoSeR)
现有的超分辨率(SR)模型主要关注恢复局部纹理细节,往往忽略了场景中的全局语义信息。这种疏忽可能导致在恢复过程中遗漏关键的语义细节或引入不准确的纹理。在我们的工作中,我们引入了认知超分辨率 (CoSeR) 框架,使 SR 模型具有理解低分辨率图像的能力。我们通过结合图像外观和语言理解来生成认知嵌入来实现这一点,它不仅激活来自大型文本到图像扩散模型的先验信息但也有助于生成高质量的参考图像来优化SR过程。为了进一步提高图像保真度,我们提出了一种新的条件注入方案,称为“All-in-Attention”,将所有条
2024-03-28 09:23:51 6196
原创 【图像超分】论文精读:Enhanced Deep Residual Networks for Single Image Super-Resolution(EDSR和MDSR)
最近对超分辨率的研究随着深度卷积神经网络 (DCNN) 的发展取得了进展。特别是,残差学习技术表现出更好的性能。在本文中,我们开发了一个增强的深度超分辨率网络(EDSR),其性能超过了当前最先进的 SR 方法。我们模型的显着性能改进是由于通过删除传统残差网络中不必要的模块进行优化。当我们稳定训练过程时,通过扩展模型大小可以进一步提高性能。我们还提出了一种新的多尺度深度超分辨率系统(MDSR)和训练方法,该方法可以在单个模型中重建不同缩放因子的高分辨率图像。所提出的方法在基准数据集上比最先进的方法表现出更好的
2024-03-28 09:23:22 6153
原创 【图像超分】论文精读:Resolution enhancement in scanning electron microscopy using deep learning
我们报告了使用生成对抗网络的扫描电子显微镜 (SEM) 图像中的分辨率增强。我们通过推断低分辨率 SEM 图像中的未解析特征并将它们与相同样本的准确共同配准的高分辨率 SEM 图像进行比较来证明这种基于深度学习的超分辨率技术的准确性。通过空间频率分析,我们还报告了我们的方法生成具有频谱的图像,该频谱匹配相同视场的更高分辨率的 SEM 图像。通过使用这种技术,可以更快地获取更高分辨率的 SEM 图像,同时还可以减少样品的电子充电和损坏。
2024-03-27 07:32:45 6325
原创 【图像超分】论文精读:APISR: Anime Production Inspired Real-World Anime Super-Resolution
虽然现实世界的动漫超分辨率(SR)在SR社区中受到越来越多的关注,但现有的方法仍然采用照片级真实感领域的技术。在本文中,我们分析了动漫制作工作流程,并重新思考如何为了现实世界的动漫 SR 使用它的特征。首先,我们认为由于重复使用手绘帧,视频网络和数据集对于动漫 SR 不是必需的。相反,我们通过从视频源中选择最压缩和信息量最大的帧,提出了一种动漫图像收集管道。基于这个管道,我们介绍了 Anime Production-oriented Image (API) 数据集。此外,我们确定了扭曲和微弱的手绘线和不需要
2024-03-27 07:31:50 6423
原创 【图像超分/扩散模型】论文精读:Exploiting Diffusion Prior for Real-World Image Super-Resolution(StableSR)
我们提出了一种新的方法来利用封装在预先训练的文本到图像扩散模型中的先验知识进行盲超分辨率(SR)。具体来说,通过使用我们的时间感知编码器,我们可以在不改变预训练的合成模型的情况下实现有希望的恢复结果,从而保留生成先验并最小化训练成本。为了解决扩散模型固有随机性造成的保真度损失,我们采用了一个可控的特征包装模块,该模块允许用户在推理过程中简单地调整标量值来平衡质量和保真度。此外,我们开发了一种渐进聚合采样策略来克服预训练扩散模型的固定大小约束,从而能够适应任何大小的分辨率。
2024-03-26 07:28:11 6650
原创 【扩散模型】论文精读:Denoising Diffusion Probabilistic Models(DDPM)
我们使用扩散概率模型展示了高质量的图像合成结果,这是一种受非平衡热力学考虑启发的潜在变量模型。我们最好的结果是通过对加权变分界进行训练获得的,该边界是根据扩散概率模型和与朗之万动力学的去噪分数匹配之间的新联系设计的,我们的模型自然承认渐进式有损解压缩方案,可以解释为自回归解码的泛化。在无条件 CIFAR10 数据集上,我们获得了 9.46 的 Inception 分数和 3.17 的最新 FID 分数。在 256x256 LSUN 上,我们获得了类似于 ProgressiveGAN 的样本质量。
2024-03-26 07:27:04 7649
原创 【图像超分】论文复现:Pytorch实现DRRN,完美复现论文中的结果(Scale=2,PSNR=37.74)
【图像超分】论文精读:Image Super-Resolution via Deep Recursive Residual Network (DRRN)请配合上述论文精读文章使用,效果更佳!
2024-03-25 15:51:56 6726
原创 【图像超分】论文复现:万字长文!Pytorch实现VDSR!血与泪的数据处理与训练过程总结!深度学习中的各种踩坑记录!适合各种深度学习新手!帮助你少走弯路!附PSNR最优的VDSR模型权重文件!
【图像超分】论文精读:Accurate Image Super-Resolution Using Very Deep Convolutional Networks (VDSR)请配合上述论文精读文章使用,效果更佳!本文综合现有的VDSR相关代码,用pytorch实现极简风格的VDSR,复现论文。
2024-03-18 10:16:56 9175 2
原创 【图像超分】论文精读:Image Super-Resolution via Deep Recursive Residual Network (DRRN)
最近,基于卷积神经网络 (CNN) 的模型在单图像超分辨率 (SISR) 方面取得了巨大成功。由于深度网络的强度,这些 CNN 模型从低分辨率输入图像学习到高分辨率目标图像的有效非线性映射,但代价是需要大量的参数。本文提出了一种非常深的 CNN 模型(最多 52 个卷积层),称为深度递归残差网络 (DRRN),用于努力实现深度而简洁的网络。具体来说,采用残差学习,无论是全局还是局部方式,以减轻训练非常深的网络的难度;递归学习用于在增加深度的同时控制模型参数。广泛的基准评估表明,DRRN 在利用更少的参数的同
2024-03-18 10:14:04 8880
原创 【图像超分】论文精读:Deeply-Recursive Convolutional Network for Image Super-Resolution (DRCN)
我们提出了一种使用深度递归卷积网络 (DRCN) 的图像超分辨率方法 (SR)。我们的网络有一个非常深的递归层(最多 16 个递归)。增加递归深度可以提高性能,而无需为额外的卷积引入新的参数。尽管具有优势,但由于梯度爆炸/消失,使用标准梯度下降法学习 DRCN 非常困难。为了减轻训练的难度,我们提出了两个扩展:递归监督和跳层连接。我们的方法大大优于以前的方法。
2024-03-15 14:58:55 9177
原创 【图像拼接/线段匹配】论文精读:Line Matching in Wide-Baseline Stereo: A Top-Down Approach
本文介绍了一种新的算法,用于跨图像匹配线,该算法利用线对之间的极线几何和共面约束。与兴趣点匹配的常见处理相比,我们使用极线几何来约束线对之间的共面条件。这种处理消除了由于具有不匹配端点的不完全线观测而导致的潜在匹配问题。这一观察结果用于检测一组候选行对对应关系。然后通过从相邻兴趣点对应导出的局部单应变换来验证这些匹配对。这一步产生了一个线亲和矩阵,该矩阵经过处理以获得匹配线。在这个过程中,我们不使用外观模型,并表明所提出的处理优于最先进的外观和基于几何的方法,特别是对于基线宽的图像。
2024-03-15 14:51:05 8425
原创 【图像拼接/视频拼接】论文精读:Eliminating Warping Shakes for Unsupervised Online Video Stitching(StabStitch)
在本文中,我们将视频拼接重新定位到一个新兴的问题,称为扭曲抖动,将图像拼接扩展到视频拼接。它揭示了非重叠区域中扭曲内容的时间不稳定性,尽管图像拼接努力保持自然结构。因此,在大多数情况下,即使要拼接的输入视频是稳定的,拼接后的视频不可避免地会造成不希望的翘曲抖动,影响视觉体验。为了消除抖动,我们提出了StabStitch,在统一的无监督学习框架中同时实现视频拼接和视频稳定。从视频稳定中的相机路径开始,我们首先通过精心整合空间和时间扭曲来导出视频拼接中拼接轨迹的表达。然后提出了一个扭曲平滑模型来优化它们,并综合
2024-03-14 10:57:25 9339
原创 【图像超分】论文精读:Accurate Image Super-Resolution Using Very Deep Convolutional Networks (VDSR)
我们提出了一种高精度的单图像超分辨率(SR)方法。我们的方法使用了一个非常深的卷积网络,灵感来自用于 ImageNet 分类的 VGG-net [19]。我们发现增加我们的网络深度可以显着提高准确性。我们的最终模型使用 20 个权重层。通过在深度网络结构中多次级联小过滤器,以有效的方式利用大图像区域的上下文信息。然而,随着非常深的网络,收敛速度成为训练期间的关键问题。我们提出了一个简单而有效的训练过程。我们只学习残差,并使用可调梯度裁剪实现的极高学习率(比 SRCNN [6] 高 104 倍)。我们提出的方
2024-03-14 10:56:22 9469
原创 【图像超分】论文复现:Pytorch实现ESPCN
论文精读:由于ESPCN没有公布源码,我们选择github上一个高star的项目来复现。准备数据集,以及数据预处理搭建网络模型设置参数并训练测试训练好的模型用训练好的模型测试自己的数据本文我们使用pycharm链接服务器训练。
2024-03-13 10:57:46 9786 1
原创 【图像超分】论文精读:efficient sub-pixel convolutional neural network (ESPCN)
最近,基于深度神经网络的几个模型在单幅图像超分辨率的重构精度和计算性能方面都取得了巨大的成功。在这些方法中,低分辨率 (LR) 输入图像在重建之前使用单个滤波器(通常是双三次插值)放大到高分辨率 (HR) 空间。这意味着超分辨率 (SR) 操作是在 HR 空间中执行的。我们证明了这是次优的,并增加了计算复杂度。在本文中,我们提出了第一个卷积神经网络 (CNN),能够在单个 K2 GPU 上实时 SR 1080p 视频。为了实现这一点,我们提出了一种新颖的 CNN 架构,其中特征图是在 LR 空间中提取的。此
2024-03-13 10:57:15 9734
原创 【图像超分】论文复现:Pytorch实现FSRCNN,包含详细实验流程和与SRCNN的比较
请配合上述论文精读文章使用,效果更佳!不想理解原理,希望直接跑通然后应用到自己的图像数据的同学,请直接下载上面的代码,有训练好的模型,直接用即可。具体使用方式见代码中的README!有问题来本文评论区留言!准备数据集,以及数据预处理搭建网络模型设置参数并训练测试训练好的模型用训练好的模型测试自己的数据硬件环境:windows11+RTX 2060(比这个高肯定没问题,我这个配置本机跑500个epoch一点问题没有,一会就跑完。但超分自己的图像时,如果图像很大,可能有内存溢出的错误。
2024-03-12 17:53:32 9802
原创 【图像超分】论文精读:Accelerating the Super-Resolution Convolutional Neural Network(FSRCNN)
作为应用于图像超分辨率 (SR) 的成功深度模型,超分辨率卷积神经网络 (SRCNN) [1,2] 在速度和恢复质量方面都比以前的手工制作的模型表现出更好的性能。然而,高计算成本仍然阻碍了它的实际使用,这需要实时性能(24 fps)。在本文中,我们旨在加速当前的 SRCNN,并提出了一种紧凑的沙漏形 CNN 结构,以实现更快和更好的 SR。我们从两个方面重新设计了SRCNN结构。首先,我们在网络末端引入了一个反卷积层,然后将映射直接从原始低分辨率图像(无插值)学习到高分辨率图像。其次,我们通过在映射之前缩小
2024-03-12 17:52:29 9680
原创 【图像超分】论文复现:新手入门!Pytorch实现SRCNN,数据预处理、模型训练、测试、评估全流程详解,注释详细,简单修改就可以训练你自己的图像数据,有训练好的模型下载地址,随取随用
【图像超分】论文精读:Image Super-Resolution Using Deep Convolutional Networks(SRCNN)请配合上述论文精读文章使用,效果更佳!图像超分辨率SRCNN和FSRCNN复现代码,除基本的网络实现外,还有特征图可视化,PSNR曲线图可视化,测试自己的图像数据等不想理解原理,希望直接跑通然后应用到自己的图像数据的同学,请直接下载上面的代码,有训练好的模型,直接用即可。具体使用方式见代码中的README!有问题来本文评论区留言!准备数据集,以及数据预处理。
2024-03-11 11:10:05 10882 23
原创 【图像超分】论文精读:Image Super-Resolution Using Deep Convolutional Networks(SRCNN)
我们提出了一种用于单幅图像超分辨率(SR)的深度学习方法。我们的方法直接学习低/高分辨率图像之间的端到端映射。该映射被表示为深度卷积神经网络(CNN),它以低分辨率图像为输入,输出高分辨率图像。我们进一步表明,传统的基于稀疏编码的 SR 方法也可以被视为深度卷积网络。但是与单独处理每个组件的传统方法不同,我们的方法联合优化所有层。我们的深度 CNN 具有轻量级结构,但展示了最先进的恢复质量,并实现了实际在线使用的快速速度。我们探索了不同的网络结构和参数设置,以实现性能和速度之间的权衡。此外,我们扩展了我们的
2024-03-11 11:09:19 9688 2
原创 【图像拼接/视频拼接】论文精读:Efficient Video Stitching Based on Fast Structure Deformation
在计算机视觉中,视频拼接是一个非常具有挑战性的问题。在本文中,我们提出了一种基于快速结构变形的高效、有效的广角视频拼接方法,该方法能够同时实现质量拼接和计算效率。对于一组同步帧,首先,设计了一种有效的双缝选择方案来搜索两幅原始图像中两个不同但结构对应的接缝。进一步考虑前一帧的接缝位置以保持帧间的一致性。其次,沿双接缝,进行一维特征检测和匹配,以捕捉两个相邻视图之间的结构关系。第三,在特征匹配之后,我们提出了一种有效的算法来线性传播变形向量以消除结构错位。最后,通过基于连续松弛迭代 (SOI) 求解器的快速梯
2024-03-03 16:27:45 10033 2
原创 【图像拼接】Towards All Weather and Unobstructed Multi-Spectral Image Stitching: Algorithm and Benchmark
图像拼接是一项基本任务,需要来自不同视点的多个图像来生成广泛的视场(FOV)场景。以前的方法是在 RGB 图像上开发的。然而,可见光图像上的雨、雾、弱光、强光等恶劣天气和恶劣条件可能会引入明显的干扰,导致拼接结果的失真和错位。为了弥补光学传感器的成像不足,我们研究了红外和可见光图像之间的互补性,以提高对视觉信息和观看范围场景的感知。我们开发了一种可学习的特征自适应网络来研究面向缝合的特征表示,并在特征融合引起的不准确积累阻碍了拼接的性能,特别是内容丢失和重影效果,而不是级联融合缝合过程,并在特征级别执行信息
2024-02-29 10:58:19 10070
原创 【图像拼接】论文精读:UAV Image Stitching With Transformer and Small Grid Reformation
由于视差和关键点不足,很难拼接结构不丰富的无人机(UAV)图像,本文对此进行了讨论。全局匹配由训练有素的转换器判断和局部相似性,这提供了在低特征区域找到大量关键点的可能性。基于变压器的分数设计了一种新的点匹配约束。线路保护和失真电阻也用于局部校正,以减轻全局像差。实验结果表明,我们的方法在拼接不显眼的特征(如林地、裸地和河流)方面明显优于四种最先进的算法,将位置误差减少了一半。
2024-02-29 10:57:22 10115
原创 【图像拼接】论文精读:Automatic Quaternion-Domain Color Image Stitching(AQCIS)
利用彩色图像的四元数表示,提出了一种四元数感知接缝线检测模型来生成四元数域中的接缝线。它将接缝线检测视为四元数域彩色图像标记问题,并最小化局部区域四元数感知差异成本以获得最优接缝线。为了有效地评估接缝线质量,我们开发了一种四元数感知接缝线质量度量。基于所提出的四元数感知接缝线检测模型和质量度量,我们进一步提出了一种用于自动四元数域彩色图像拼接 (AQCIS) 的通用框架。据我们所知,这是第一次尝试在四元数域中完全执行彩色图像拼接。同时,AQCIS以迭代的方式引入了局部对齐和接缝线的联合优化策略。在具有挑战性
2024-02-28 09:58:23 10266
原创 【图像拼接】论文精读:Image stitching based on human visual system and SIFT algorithm
图像拼接过程通常会产生许多不良影响。解决图片不连续和错位等问题一直是人们研究的重点。从人类视觉的角度来看,这种位错情况很容易被感知和发现。本文提出了一种基于人类视觉系统(HVS)和尺度不变特征变换(SIFT)算法的拼接策略。我们对拼接图像的亮度差和对比度进行预处理,结合SIFT算法和HVS对拼接图像的重叠区域进行划分,建立属性关系模型。我们使用动态规划根据属性关系模型找到最优接缝线,最终结果使最优接缝线在人眼的判别视觉下几乎不可见。实验结果表明,我们的方法在 HVS 中具有更大的优势。
2024-02-28 09:57:32 10242
原创 【图像拼接】论文精读:Object-level Geometric Structure Preserving for Natural Image Stitching(OBJ-GSP)
具有全局自然结构的拼接图像的主题具有至关重要的意义。目前的方法表现出保持局部几何结构的能力,但在保持这些几何结构之间的关系方面却不足。在本文中,我们努力基于全局相似性先验保护图像中的整体目标级结构,同时减轻带有 OBJ-GSP 的失真和重影伪影。我们的方法利用Segment Anything Model[25]提取语义信息的几何结构,增强了算法以更符合人类感知的方式保留对象的能力。我们试图识别控制各种几何边界之间关系的空间约束。认识到多个几何边界共同定义了完整的对象,我们采用三角形网格不仅保护单个几何结构
2024-02-27 14:03:06 10960
原创 【图像拼接】论文精读Towards Robust Image Stitching: An Adaptive Resistance Learning against Compatible Attacks
图像拼接无缝地将从不同视角捕获的图像集成到一个单一的宽视场图像中。这种集成不仅拓宽了捕获的场景,而且增强了计算机视觉应用的整体感知。给定一对捕获的图像,人类视觉系统未被注意到的细微扰动和失真往往会攻击对应匹配,损害图像拼接算法的性能。鉴于这一挑战,本文首次尝试提高图像拼接对对抗性攻击的鲁棒性。具体来说,我们引入了一种面向拼接的攻击(SoA),旨在放大重叠区域内的对齐损失,从而针对特征匹配过程。为了建立抗攻击模型,我们深入研究了拼接架构的鲁棒性,并开发了自适应对抗训练(AAT)来平衡抗攻击能力与拼接精度。通过
2024-02-27 14:02:15 10824
原创 【图像拼接】论文精读:A fast and stable seam selection algorithm for video stitching based on seam temporal pro
本文提出了一种适用于时间同步视频流的快速稳定的接缝选择方法。该方法计算时间低,性能好,使用帧进行帧校正。本文的主要贡献是所提出的接缝时间传播约束,它利用空间上下文信息来避免连续视频帧之间的大接缝偏移引起的伪影。此外,引入了一种增强的动态规划算法来获得执行时间相对较低的最优接缝。采用视频拼接平台对所提出的方法与现有方法进行了详细的实验比较。我们的结果表明,在视频拼接中使用上下文信息可以显着提高伪影。关键词:视频拼接;接缝选择;接缝时间传播;增强的动态规划。
2024-02-08 09:42:42 12549
原创 【图像拼接】论文精读:Rectangular-Output Image Stitching(RDISNet)
图像拼接的目的是将两幅图像与重叠区域相结合,扩展视场(FoV)。然而,现有方法的拼接图像不规则,需要矩形方法处理,耗时长,容易不自然。本文提出了第一个端到端框架,矩形输出深度图像拼接网络(RDISNet),直接学习两幅图像拼接成一个标准的矩形图像,同时学习图像对之间的颜色一致性,保持内容的真实性。为了进一步保留拼接图像中大物体的结构,我们设计了一个扩展的BN-RCU块来扩展RDISNet的接受域,提取丰富的空间上下文。此外,我们设计了一种新的数据合成管道,构建了第一个矩形输出深度图像拼接数据集(RDIS-D
2024-02-08 09:42:08 13438 1
原创 【图像拼接】论文精读:A Virtual Reality Video Stitching System Based on Mirror Pyramids
本文提出了一种基于镜像金字塔的虚拟现实视频获取方法。该系统旨在捕获高清立体视频,而镜像金字塔允许用户拍摄位于相机附近的对象。首先,我们从理论上研究了镜面反射器件的立体成像,验证了其可行性。其次,我们提出了一个完整的拼接过程,包括特殊成像设备的校准、掩模提取和融合。3D成像方法的镜像反射允许用户拍摄近距离物体并实现出色的3D效果。
2024-02-07 09:42:01 12896
原创 【图像拼接】论文精读:A video stitching system based on mirror pyramids and non-overlapping calibration method
市场上的全景相机不允许在存在非零视差角的情况下无缝拼接靠近相机的物体。同时,传统的实时拼接技术要求摄像机组的几何形状是已知的,外部投影点用于手动找到重叠区域的特征点。因此,本文提出了一种通过标定创建反射镜反射全景实时拼接系统的方法。由于每个相机拍摄的图像具有非常窄的重叠区域,提出了一种非重叠校准方法,只需旋转四个固定的校准模式,即可完成一个简单而方便的校准工作,效果明显。相机在实时视频中捕捉特写镜头的能力对于全景视频拍摄的未来具有重要意义。
2024-02-07 09:41:29 12883
原创 【图像拼接】论文精读:Fisheye image rectification for efficient large-scale stereo
近年来,使用鱼眼镜头的立体视觉因其广泛的应用而受到越来越多的关注。作为立体处理的基本先决条件,本文提出了一种鱼眼图像校正方法,用于高效的大规模立体。场景距离是在球形模型中制定的。使用横向墨卡托投影重新投影原始图像使我们能够证明一个定理,该定理可以将距离计算简化为常数和视差的除法运算。实验结果表明,使用该方法的立体处理在保持令人满意的匹配质量的同时,可以获得比现有方法更快的计算速度。
2024-02-06 12:39:05 13187
图像超分辨率WDSR的Pytorch复现代码,注释详细,含科研绘图,最优SSIM和PSNR的模型权重文件(x2、x3、x4)
2024-04-30
图像超分辨率RDN的Pytorch版本复现代码,注释详细,易读易复用,含最优SSIM和PSNR的模型权重文件(x2、x3、x4)
2024-04-28
Python实现多图像转换成连贯的PDF文件,支持所有图片格式,可预览、裁剪、自定义PDF布局、设置图像顺序、PDF质量选择等
2024-04-28
毕业设计 - 基于PyQt5和SMTP协议实现邮件发送程序(python)
2024-04-24
毕业设计-基于Socket通信PyQt5仿QQ聊天系统设计(python)
2024-04-24
毕业设计 - 基于Python+PyQt5+OpenCV人脸识别系统设计
2024-04-24
毕业设计 - 基于知识图谱的电影推荐系统(python)
2024-04-24
基于Python的常见临床统计分析:包括组样本t检验、基于感知机/神经网络的临床多因素预测模型、ROC曲线绘制等
2024-04-19
如何识别区分工件正反面?
2023-03-13
TA创建的收藏夹 TA关注的收藏夹
TA关注的人