Anime4K:目前最热的开源实时动漫放大算法,Github上一周收获2600星!

点击我爱计算机视觉标星,更快获取CVML新技术


今天跟大家介绍一款动漫画面放大算法Anime4K,目前最热的开源、实时、视频动漫放大算法。

https://github.com/bloc97/Anime4K

一周内该库在Github上收获2600+星,作者6天前在reddit上推介了该项目,也成为了大家的热门话题,引起极大关注!

为什么呢?

在这个“言必称深度、学必讲统计”的AI时代,Anime4K完全没有使用深度学习、统计方法,而且速度非常快!

下图展示了使用Anime4K将动漫画面从1080p提升到2160p的效果:

时间仅需要3ms。(计算硬件Vega 64 GPU)

下图为与其他相同功能开源库的比较:

Anime4K在视觉效果最好的情况下,速度则是完胜!

作者称Anime4K 非常适合动漫放大任务,速度极快、能够保持视频内容连贯、实现只需约100行代码、效果也异常的好。

Anime4K 不使用任何机器学习或统计方法,非常适合于要保持清晰边缘和线段,而能够容忍丢失一些精细纹理的情况。 它是一种迭代算法,将颜色信息视为高度图并使用渐变上升将像素“推”到可能的边缘。 

作者认为这很可能是基于学习的方法内部已经在做的(例如VDSR,waifu2x)。

算法原理

Anime4K 仅适用于动漫图像放大,因动漫往往没有丰富的纹理,而人眼对其边缘和线段更加敏感。

图像超分辨率的一般流程:

LR_U为上采样后的低分辨率图像,r为高频残差,高分辨率图像HR = LR_U + r。

以往大部分算法都是在预测r。

作者发现这样一个事实,对于锐利图像其残差图像中边缘和线段往往比较细,而对于模糊图像,其残差图像中边缘和线段往往比较粗。

算法的主要目标是不断修改LR_U(低分辨率采样得到的模糊图像),直到其残差变得最细,给我们一个尽可能锐利的HR图像。

输入LR_U及其初始残差r,“推”(push)残差的像素,使残差图中线段边缘变得更细。对于作用于残差图中执行的每个“推”操作,在彩色图像上执行相同操作。 这具有迭代地使图像梯度最大化的效果,其在数学上等同于最小化模糊,但这种方法没有在传统方法中常见的振铃等伪像。

伪代码描述就下面几行:

  for each pixel on the image:
    for each direction (north, northeast, east, etc.):
      using the residual, if an edge is found:
        push the residual pixel in the current direction
        push the color pixel in the current direction

原理细节详见:

https://github.com/bloc97/Anime4K/blob/master/Preprint.md#proposed-method

更多放大结果:

无论在哪种设置下,Anime4K都取得了更佳的视觉效果。

开源地址:

https://github.com/bloc97/Anime4K


图像超分辨率交流群

关注最新最前沿的图像、视频超分辨技术,欢迎加入专属交流群,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:SR)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
告别AV画质:实时把动画变成4k高清,延时仅3毫秒,登上GitHub趋势榜 量子位 量子位 ​ 已认证的官方帐号 7,564 人赞同了该文章 栗子 发自 凹非寺 量子位 出品 | 公众号 QbitAI △ 来自《珈百璃的堕落》 看动画 (特别是里番) 的时候,总会觉得画质不够好,就算已经有1080p,还是会感到不够清晰。 所以,这个世界十分需要一套拯救分辨率的魔法。 如今,有个名叫Anime4K的开源算法,能在动画播放中,实时把画面变成4k,延时低至3毫秒。 能把720p/1080p变成2160p,也能把480p变成1080p。 团队说,这是当下最强 (State-of-the-Art) 的动画实时超分辨率方法,可以拿任何编程语言实现。 现在,项目已经在GitHub摘下3700多颗,并一度登上了趋势榜。 那么,这个算法究竟是如何造福人类的? 只搞动画 团队在论文里感慨道: 传统超分辨率算法 (如Bicubic) ,结果不怎么好,因为它们根本不是为了动画而生的。 传统的去模糊 (Unblurring) 或锐化 (Sharpening) 方式,在靠近物体边缘的时候会发生过冲 (Overshoot) ,分散观众注意力,降低图像的感知质量 (Perceptual Quality) 。 而机器学习方法 (如waifu2x) 又太慢,完全不能实时 (<30毫秒) ,尤其是需要超高清的时候。 △ waifu2x 而Anime4K,只处理动画就够了,不考虑其他视频类型。这一点很重要。 动画没有真实视频那么多纹理 (Textures) ,基本都是用平直着色法 (Flat Shading) 处理的物体和线条。 只要画质变好一点点,观众也看得出。所以团队机智地想到,不用做整张的画质提升,专注于细化边缘就可以了,纹理之类的细节不重要。 具体怎样做,要从超分辨率的原理开始讲: 首先,一张图可以分为两部分: 一是低频分量,就是一张模糊的低分辨率图。二是高频残差,代表两种分辨率之间的差别 (Difference) 。 输入一张低清图,把它变成一个更低清的版本,就能得出一个残差。 把残差变薄 (Thin) 、锐化 (Sharpen) ,再加到低清图上,就能得到一张高清图。 但残差稍稍有点错误,就会造成振铃和过冲,影响效果。这也是前辈的缺陷所在。 于是,团队找到了一种新方法: 首先把残差厚度最小化当做目标,这个没有问题。 但直接把随意变换(Arbitrarily Transformed)得到的残差,用到一张低清图上是不行的。低清图要做出相应改变,才能与残差和平相处,得出理想的超分辨率结果。 所以,当输入一张图和它的残差之后,“push”残差的像素,让残差线变细; 同时,每做一个push,都要在彩色的低清图上,执行一个相同的操作。 这样,既能把模糊最小化,也不会出现振铃和过冲,这两个降低画质的现象。 比一比吧 这场比赛,Anime4K (最右) 的对手有:来自madVR的不开源算法NGU前辈 (左二) ,以及开源的机器学习算法waifu2x前辈 (左三) 。 第一题,眼睛: 第二题,耳朵: 第三题,玉手: 第四题,全脸: waifu2x前辈的效果,明显不及Anime4K,常见虚影。速度也有明显缺陷,每张图耗时超过1秒。 NGU前辈生成的画质,与Anime4K相近,但也常常被Anime4K打败。 不止如此,NGU每张耗时~6毫秒,Anime4K只要~3毫秒,快了一倍,更加适应实时生成的需求了。 效果相近的话,为啥不直接用NGU?因为不开源。 如果,你觉得720p/1080p的动画,没必要变成4K这么奢侈,那还可以把480p拯救到1080p啊: 依然,Anime4K和没开源的NGU不相上下。 最后,尽管已经获得了精湛的画质提升技能,团队也没有就此抛弃机器学习的力量。 因为在拯救静止画作 (而非动画) 的时候,Anime4K的短板显现了。这时候,让机器学习选手waifu2x和它并肩作战,更加成功一些: 需要实时给动画提升分辨率,还是只用Anime4K吧。 反正也已经开源了。 项目传送门: bloc97/Anime4K ​ github.com 图标 论文传送门: https://github.com/bloc97/Anime4K/blob/master/Preprint.md ​ github.com — 完 —
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值