超高清视频处理技术
文章平均质量分 91
本专栏总结超高清视频处理领域内相关技术,包括视频增强、去噪声、超分辨、帧率提升等。
BigerBang
图像/视频修复与增强、超分辨率、sdr2hdr、插帧
展开
-
超分中的GAN总结:常用的判别器类型和GAN loss类型
总结了GAN在图像超分辨率中的应用,包括常用的判别器类型:经典的分类网络、patch gan和unet和GAN loss类型: gan、wgan、lsgan、ragan原创 2024-08-24 11:36:16 · 1071 阅读 · 0 评论 -
CRAFT文字检测算法解析和基于C++和TensorRT的推理实现
本文讲解了CVPR 2019的一篇文字检测算法《Character Region Awareness for Text Detection》的原理,并给出我使用**C++和TensorRT**重新实现的推理,速度比原版代码快12倍。原创 2024-04-21 14:40:34 · 1144 阅读 · 0 评论 -
HAT论文详解:Activating More Pixels in Image Super-Resolution Transformer
本文是对Swinir的改进,目前很多图像超分Benchmark的SOTA。相对于SwinIR的改进主要有三个地方:1. 引入Channel Attention,以获得更好的全局能力;2. 提出了overlapping cross-attention模块,来进行跨window的信息交互;3. 提出一个预训练策略。上面两张图分别是HAT和SwinIR的整体结构图,可以看出HAT延续了SwinIR的基本结构,将RSTB升级成RHAG,内部的STL也对应升级成HAB,并且在每个Block中加入了一个OCAB。原创 2024-02-22 19:35:10 · 1291 阅读 · 0 评论 -
ICCV2021 SDR2HDR论文笔记:A New Journey from SDRTV to HDRTV
code: https://github.com/chxy95/HDRTVNet本文是ICCV2021文章《A New Journey from SDRTV to HDRTV》的阅读笔记,个人认为该文章是sdr2hdr领域比较重要的一篇文章,其完成了视频sdr2hdr问题的定义、问题特性的分析、提出了一种方法、公开了一个数据集HDRTV1K、提出了5种评价指标,接下来记录了文章的要点。1. introduction为什么需要sdr2hdr算法?(1) 视频内容正在从标清、高清向超高清发展,而高动原创 2022-04-08 16:28:51 · 6217 阅读 · 9 评论 -
OKLAB颜色空间详解 2 ——颜色空间转换、oklab空间中的色域确定
本文主要介绍以下两个方面:介绍并用python实现了oklab空间与XYZ空间的转换介绍并用python实现了在oklab空间如何确定一个色域的范围1. oklab与XYZ互相转换(1)XYZ向oklab空间转换总共三步,两步矩阵乘法+一步非线性变换, 计算简单是oklab的一大优点;第一步是将XYZ转换到一个近似的锥体细胞反应 lms:第二步是一个非线性变换:第三步是转换至Lab的坐标下:上式中的M1、M2的数值如下:(2)从oklab到XYZ的变换是上述过程的逆过程,如下所原创 2021-06-20 17:10:35 · 1726 阅读 · 0 评论 -
cvpr 2021图像增强论文笔记Multi-Stage Progressive Image Restoration详解
CVPR 2021 Multi-Stage Progressive Image Restorationcode: https://github.com/swz30/MPRNet简要记录下这篇文章的要点。提出问题:图像增强领域框架基本上分为两种设计:Encoder-decoder可以有效获取多尺度信息,但会牺牲空间细节;A single scale feature pipeline得到的图像有很好的空间细节,但是由于感受野较小,语义鲁棒性较差;因此:Image restorati原创 2021-04-15 18:23:29 · 4026 阅读 · 0 评论 -
PixelShuffle详解和cuda实现
1.背景1.1 PixelShuffle的出处PixelShuffle这一操作出自论文[https://arxiv.org/abs/1609.05158](Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network), 论文中称为periodic shuffling operator。Pytorch将其实现为torch.nn.PixleShuffl原创 2020-09-12 17:36:55 · 4908 阅读 · 3 评论 -
详解插帧算法DAIN论文和代码(Depth-Aware Video Frame Interpolation)
Depth-Aware Video Frame Interpolationflow estimationdepth estimationapproximate the intermediate flows1.depth-aware flow projection 2.hole position flow 填充adaptive warping layersthe flow projection 通过reverse在时刻t经过x位置的flow来估计t时刻x位置的中间flow.F0−>1原创 2020-06-20 14:24:45 · 8516 阅读 · 3 评论 -
x265支持hdr10编码
问题编译过x265和ffmpeg之后,用以下命令对hdr10编码:ffmpeg -i input.mp4 -c:v libx265 -x265-params "hrd=1:aud=1:no-info=1:sar='1:1':colorprim='bt2020':transfer='smpte2084':colormatrix='bt2020nc':master-display='G(8500,39850)B(6500,2300)R(35400,14600)WP(15635,16450)L(0,0)':m原创 2020-06-09 19:15:04 · 2291 阅读 · 2 评论 -
使用ffmpeg退化视频质量-制作视频增强数据集
1.噪声ffmpeg noise filterffmpeg -i Youku_00002_h_GT.y4m -vf noise=alls=20:allf=t,format=yuv420p -vcodec libx264 -x264opts qp=12 -y output..mp4原创 2020-06-06 19:35:20 · 2149 阅读 · 0 评论