- 博客(8)
- 资源 (29)
- 问答 (1)
- 收藏
- 关注
原创 ICASSP2021:端到端的图像编码方法
本文来自ICASSP2021论文《Image Coding For Machines: An End-to-end Learned Approach》基于深度学习的计算机视觉在图像领域应用越来越广泛,每天产生的图像数量爆发式增长,传统的图片编码器是面向人眼视觉而不是机器处理。本文提出基于神经网络(NN)的端到端学习的面向机器的图像编码器(Image Coding for Machines,ICM)。本文算法本文ICM模型的优化目标是机器任务的性能而不是像素保真度,模型包含一个自编码器,一
2021-08-31 22:02:36 30031
原创 ICASSP2021:面向SCC的自适应双重树结构
本文来自ICASSP2021论文《Adaptive Dual Tree Structure for Screen Content Coding》在HEVC中,CTU采用四叉树方式递归划分,同一个CTU的亮度CTB和色度CTB采用相同的划分结构即单重树结构。而对于VVC,采用帧内预测模式的CTU的亮度CTB和色度CTB可以使用不同的划分方式即双重树结构。Fig.1是双重树结构的示例,蓝色和绿色分别代表亮度和色度CTB划分结果。双重树结构对于摄像机拍摄的内容非常高效,但是对于屏幕内容色度和亮..
2021-08-24 23:18:11 29271
原创 快手K266Dec
简介K266Dec是快手公司为ARM平台设计的VVC软件解码器,在JVET-V0070提案中有相关介绍。这款解码器是根据VVC标准从头设计的,支持VVC main profile的所有编码工具。对于Android平台,在Huawei P40上,以单线程解码2K 8bit CTC码流速度能达到33fps,是VTM11.0解码器的4.11倍。对于IOS平台,在iPhone 12 Pro Max上,以单线程解码2K 8bit CTC码流速度能达到94fps,是VTM11.0解码器的4.78倍。K2
2021-08-23 23:30:55 29741
原创 VVC的部署情况
本文来自JVET-w0021提案,该提案包括对VVC已部署的产品和服务、公开可用的软件源代码以及支持VVC标准的相关工具的调查。可公开获取的软件源代码VTM:VTM是JVET官方开发的参考软件,包含编码器和解码器。它主要是为了展示编码效率和解释标准中规定的语法和解码过程(不对速度进行优化)。VTM可以作为开发编码器的很好的基础,它使用BSD版权许可证。InterDigital开发了一个多线程的VTM解码器,并在2020年10月达到相当单线程参考软件6-10倍的加速比。它支持VTM的所有特性,该软
2021-08-22 09:44:25 30242
原创 ICASSP2021:通过码率限制降低ME复杂度
本文来自ICASSP2021《Relying on a Rate Constraint to Reduce Motion Estimation Complexity》运动估计ME是视频编码中最耗时的部分之一,本文提出基于码率的MV候选项消除策略。研究发现最优MV通常在MVP附近,通过限制MV的码率缩小运动搜索窗口从而减少计算复杂度。本文方法不局限于某种运动搜索模式,可以适用于各种ME策略。在VTM上实验结果显示和TZ search相比本文算法在BD-Rate损失0.74%的情况下可减少80%的复..
2021-08-18 22:44:13 30029
原创 ICASSP2021:基于显著性进行目标检测的VVC编码
本文来自ICASSP2021论文《SALIENCY-DRIVEN VERSATILE VIDEO CODING FOR NEURAL OBJECT DETECTION 》论文基于VVC提出了面向显著性的编码框架用于处理机器任务。为了在编码前获取显著性区域,论文使用YOLO进行目标检测。为了验证编码对于机器处理的效果,论文对解码图像使用Mask R-CNN进行目标分割。实验显示,使用本文算法在同样检测准确率下可以节省29%的码率。越来越多的视频不是面向人眼观看而是面向机器处理任务,通过计算机视..
2021-08-10 22:52:34 30858
原创 H266VVC电子书开放下载啦
千呼万唤始出来,历时八个多月终于完成了《最新通用视频编码标准H.266VVC》一书的第一版。在微信公众号Video Coding回复“266电子书”即可获取下载链接。
2021-08-04 09:20:37 31479
原创 ICME2021:基于机器视觉的RD模型
本文来自ICME2021论文《Visual Analysis Motivated Rate-Distortion Model for Image Coding》本文针对VVC帧内编码提出了一个面向视觉分析的RD模型,该模型包括码率控制策略和失真度量模型。首先提出了针对机器的ROI(ROIM)来度量不同CTU在视觉分析中的重要性。然后提出了基于ROIM和局部纹理特征的CTU级码率分配模型。提出多尺度特征失真(multi-scale feature distortion ,MSFD)来度量CU的失...
2021-08-02 23:08:27 31820
itu-t81.pdf
2020-03-06
现代操作系统
2017-09-13
电脑老是弹出kuupb.exe怎么办
2015-09-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人