Recurrent+Transformer 视频恢复领域的‘德艺双馨’

最新推荐文章于 2024-11-24 12:53:42 发布

我爱计算机视觉

最新推荐文章于 2024-11-24 12:53:42 发布

阅读量2k

点赞数 1

文章标签： java 机器学习人工智能计算机视觉 python

本文链接：https://blog.csdn.net/moxibingdao/article/details/125240922

版权

本文介绍了一种新的视频恢复方法——RVRT，结合了循环网络和Transformer的优点，通过片段对齐和引导变形注意力机制实现高效视频恢复。在多个数据集上达到SOTA性能，同时在模型大小和效率之间取得平衡。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

关注公众号，发现CV技术之美

本文分享论文『Recurrent Video Restoration Transformer with Guided Deformable Attention』，是 Jingyun 大佬继SwinIR，VRT之后的又一篇力作，在Transformer结构中套用了循环架构（笔者最近也在research这个点，奈何大佬太猛了）并从帧级对齐扩展到片段对齐。RVRT在VID4上超过了VRT，在REDS4上超过了Basicvsr++！

详细信息如下：