Automatic Temporally Coherent Video Colorization

系列文章目录

视频着色领域相关论文 《一》


前言

       视频及图像的着色(Colorization)技术旨在为单张或多个序列的灰度图像添加颜色,使彩色图像具有感知意义和视觉吸引力。随着深度学习技术在计算机视觉领域的广泛使用,基于深度学习的着色方法也随之出现

一、着色概述

       视频及图像的着色(Colorization)技术旨在为单张或多个序列的灰度图像添加颜色,使彩色图像具有感知意义和视觉吸引力

二、相关方法

图像着色方法主要分为三类:基于涂鸦的方法、基于参考图片的方法和基于学习的方法。

1、基于涂鸦的方法

基于涂鸦的方法指将局部用户提示(如,颜色点或笔画)戳博导整个灰度图像。颜色传播是基于一些低级的相似度测量。Levin等人的开创性工作假设亮度相似的相邻像素点应该具有相似的颜色,然后求解了传播稀疏涂鸦颜色的马尔可夫随机场(Markov Random Field)。Qu和Luan等人进一步的扩展了纹理的相似性,以及利用边缘减少颜色渗出(color bleeding)。这类方法的共同缺点是需要大量的人工工作且对专业技术的要求较高。

2、基于参考的方法

基于参考的方法采取了一种更直观的的方式,通过输入与灰度图像非常相似的参考来减少大量用户的工作。最早通过撇皮全局颜色统计来传播颜色,但由于忽略了空间像素信息,该方法在很多情况下的结果都差强人意。而近年来通过利用率从预先训练的VGG-19网络中提取的深度特征,在语义相关但视觉上不同的图像之间进行精确匹配,然后利用它进行风格迁移和颜色迁移。然而这类方法,虽然相较于基于涂鸦的方法更为便捷,但其着色结果十分依赖于参考图片的质量,如果选取的参考图像同目标图像不符,则上色结果将更为差强人意。

3、基于学习的方法

基于学习的方法完全依赖于学习来产生着色结果。利用CNN提取颜色特征并且预测结果,这些方法的关键区别在于损失函数,且不需要任何人工干预。还有一些方法使用GANs对灰度图像进行着色,GAN在高维空间(如彩色图像)上学习概率分布的能力的被广泛应用于计算机视觉任务;Isola等人提出使用基于条件GAN将输入图像映射到输出图像,他们通过结合L1损失和一种适应GAN的损失来训练网络。

三、网络框架

该网络是一个经典的CGan的结构,其网络结构如图所示,视频的着色是一个编码到解码的过程。

1、生成器

      其生成器取自U-Net的U型结构,下采样的过程获取语义信息,与之对应的上采样的过程进行定位,它由2层下采样和8个残差块以及2层上采样组成,由于U-net对输入进行多次下采样提取特征后又进行上采样,这会导致数据的丢失,特别是对于稀疏的输入数据影响更大,即信息瓶颈问题。为解决该问题,在网络中引入了残差块结构,它不需要下采样来提取特征,而是允许在训练中跳过层,同时避免梯度消失问题。

       网络的输入是当前帧的灰度图像,以及前一帧的彩色图像,在这里前一帧的彩色图像是作为网络的条件输入的,目的是引入帧间信息,保持时间一致性,两者在网络中会进行contact操作,最终生成当前帧的彩色图像。

2、鉴别器

     判别器采用PatchGAN的结构,相当于对输入图像进行若干次N✖️N大小的裁剪,裁剪后的图像相当于一个patch输入鉴别器,每个patch都输出一个预测概率值,相当于判断输入的N✖️N大小区域是真是假的概率。 直观上看它完全由卷积层构成,最后输出一个特征图即n✖️n的矩阵,取输出矩阵的均值作为判别真假概率的输出。 作用是增强图像的局部纹理细节。

四、结果分析

其实验结果如图所示:

       从表中而可以看出,相比于基础模型,TCVC不管是在FID和PSNR指标上都大大优于基础模型,同时艺术草图和灰度图像的结果对比也显示出灰度图像能给网络提供更多的纹理和细节信息,因此灰度图像的着色效果会更好。

总结

       以上就是TCVC的内容,文中提出了为数不多的用于全自动视频着色的方法,虽然相较于其他需要人工参与的方法效果较差,但其优点在于能实现全自动的着色,其亮点在于将前一帧的彩色结果作为条件引入到网络中提供时间信息,但由此也引出了它的缺点,即不能保证长时间的时间一致性。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
"503 Service Temporarily Unavailable"是一种常见的HTTP状态码,用于指示服务器暂时无法处理请求并提供服务。这通常发生在服务器过载或维护期间。 当服务器收到请求时,它会根据其当前的工作负载和可用资源来决定是否能够处理该请求。如果服务器无法处理请求,它会返回503状态码。这意味着服务器虽然正常运行,但无法提供所请求的服务。 出现503错误的情况可以有很多种原因。一种常见的原因是服务器过载。当服务器处理大量请求或处理复杂任务时,它可能无法及时响应新的请求,因此返回503状态码。此外,服务器也可能在维护期间暂时关闭,以进行系统更新或修复错误,这时同样会返回503状态码。 对于网站访问者而言,看到503错误意味着暂时无法访问所需的内容或功能。在这种情况下,用户可以稍后再次尝试访问网站或等待维护结束。网站管理员通常会及时解决服务器问题,以恢复正常的访问。 为了避免频繁出现503错误,服务器管理员可以采取一些措施。例如,增加服务器的处理能力、优化代码和数据库查询、使用负载均衡等方式可以提升服务器的性能和稳定性,从而减少503错误的发生频率。 总之,503 Service Temporarily Unavailable表示服务器暂时无法提供服务,可能是由于过载或维护等原因导致。对于用户而言,需要等待一段时间后再次尝试访问。对于服务器管理员而言,及时采取适当的措施以提高服务器性能和稳定性,以减少503错误的发生。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值