![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Diffusion论文阅读
文章平均质量分 95
阅读论文了解发展动向
阿男官官
博客当笔记
展开
-
用于视频生成的扩散模型
学习自。原创 2024-07-09 21:24:02 · 902 阅读 · 0 评论 -
[DIFF]RAVE: 使用扩散模型随机噪声清洗快速一致的视频编辑
RAVE: Randomized Noise Shuffling for Fast and Consistent Video Editing withDiffusion Models,CVPR2024原创 2024-07-03 22:17:10 · 686 阅读 · 0 评论 -
[DIFF]AT-EDM: 扩散模型的注意力驱动无训练效率增强
Attention-Driven Training-Free Efficiency Enhancement of Diffusion Models,CVPR2024原创 2024-07-02 17:54:04 · 873 阅读 · 0 评论 -
[视频编辑]AVID: Any-Length Video Inpainting with Diffusion Model
AVID: 用扩散模型做任意长度视频的编辑。原创 2024-07-01 17:50:12 · 838 阅读 · 0 评论 -
[VFI&DIFF]Video Interpolation with Diffusion Models
使用扩散模型的视频插帧(VIDIM)原创 2024-07-01 15:11:32 · 561 阅读 · 0 评论 -
[VFI]Perception-Oriented Video Frame Interpolation via Asymmetric Blending
基于非对称混合的面向感知的视频帧插值。PerVFI (Perception-oriented Video Frame Interpolation)原创 2024-06-30 20:45:10 · 923 阅读 · 0 评论 -
[VFI]A Unified Pyramid Recurrent Network for Video Frame Interpolation
本文提出了一种新的用于帧插值的统一金字塔循环网络(UPR-Net)。在一个灵活的金字塔框架中,UPR-Net利用轻量级递归模块进行双向流估计和中间帧合成。在每个金字塔级别,它利用估计的双向流来生成帧合成的前扭曲表示;在金字塔层上,它支持光流和中间帧的迭代细化。原创 2024-06-19 16:37:31 · 819 阅读 · 0 评论 -
[VFI]Extracting Motion and Appearance via Inter-Frame Attention for Efficient Video Frame Interpolat
提出EMA-VFI。有效地提取帧间运动和外观信息对于视频帧插值(VFI)具有重要意义。以前的工作要么以混合的方式提取这两种类型的信息,要么为每种类型的信息设计单独的模块,这导致了表示的歧义和低效率。在本文中,我们提出了一个新的模块来显式地提取运动和外观信息。这种混合pipeline可以减轻帧间注意的计算复杂度,也可以保留详细的低层结构信息。原创 2024-06-17 17:52:08 · 1012 阅读 · 0 评论 -
[VFI&DIFF]Motion-aware Latent Diffusion Models for Video Frame Interpolation
提出MADIFF。对于VFI任务,相邻帧间的运动估计对避免运动模糊性起着至关重要的作用。然而,现有的VFI方法总是难以准确预测连续帧之间的运动信息,这种不精确的估计会导致帧模糊和视觉上不相干的插值帧。本文提出了一种新的扩散框架,运动感知潜在扩散模型(MADIFF),它是专门为VFI任务设计的。通过在整个扩散采样过程中结合条件相邻帧与目标插值帧之间的运动先验,MADIFF逐步细化中间结果,最终产生视觉上平滑和真实的结果。原创 2024-06-16 22:04:13 · 1035 阅读 · 0 评论 -
[VFI&DIFF]LDMVFI: Video Frame Interpolation with Latent Diffusion Models
现有的视频帧插值(VFI)的工作大多采用深度神经网络,这些网络通过最小化输出和地面真实帧之间的L1、L2或深度特征空间距离(例如VGG损失)来训练。然而,最近的研究表明,这些指标是感知VFI质量的较差指标。为了发展面向感知的VFI方法,在这项工作中,我们提出了基于潜在扩散模型的VFI,LDMVFI。这将从生成的角度来处理VFI问题,并将其表述为一个条件生成问题。作为使用潜在扩散模型来解决VFI问题的首要努力,我们严格地在现有的VFI文献中使用的常见测试集上对我们的方法进行了基准测试。原创 2024-06-12 22:01:09 · 781 阅读 · 0 评论 -
[VFI综述]Video Frame Interpolation: A Comprehensive Survey
视频帧插值(VFI)是计算机视觉(CV)领域中一个有趣而具有挑战性的问题,其目的是在两个连续的视频帧之间生成不存在的帧。近年来,许多基于光流、核或相位信息的算法被提出。在本文中,我们对VFI技术的最新进展进行了全面的回顾。首先介绍了VFI算法的开发历史、评估指标和公开可用的数据集。然后详细比较每种算法,指出它们的优缺点,并比较它们在不同显著数据集上的插值性能和速度。VFI技术在CV中不断受到关注,本调查还提到了一些基于VFI的视频处理应用,如慢动作生成、视频压缩、视频恢复等。原创 2024-06-11 16:37:22 · 479 阅读 · 0 评论