2021年08月_Dillon2015

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 ICASSP2021：端到端的图像编码方法

本文来自ICASSP2021论文《Image Coding For Machines: An End-to-end Learned Approach》基于深度学习的计算机视觉在图像领域应用越来越广泛，每天产生的图像数量爆发式增长，传统的图片编码器是面向人眼视觉而不是机器处理。本文提出基于神经网络（NN）的端到端学习的面向机器的图像编码器（Image Coding for Machines，ICM）。本文算法本文ICM模型的优化目标是机器任务的性能而不是像素保真度，模型包含一个自编码器，一

2021-08-31 22:02:36 30031

原创 ICASSP2021：面向SCC的自适应双重树结构

本文来自ICASSP2021论文《Adaptive Dual Tree Structure for Screen Content Coding》在HEVC中，CTU采用四叉树方式递归划分，同一个CTU的亮度CTB和色度CTB采用相同的划分结构即单重树结构。而对于VVC，采用帧内预测模式的CTU的亮度CTB和色度CTB可以使用不同的划分方式即双重树结构。Fig.1是双重树结构的示例，蓝色和绿色分别代表亮度和色度CTB划分结果。双重树结构对于摄像机拍摄的内容非常高效，但是对于屏幕内容色度和亮..

2021-08-24 23:18:11 29271

原创快手K266Dec

简介K266Dec是快手公司为ARM平台设计的VVC软件解码器，在JVET-V0070提案中有相关介绍。这款解码器是根据VVC标准从头设计的，支持VVC main profile的所有编码工具。对于Android平台，在Huawei P40上，以单线程解码2K 8bit CTC码流速度能达到33fps，是VTM11.0解码器的4.11倍。对于IOS平台，在iPhone 12 Pro Max上，以单线程解码2K 8bit CTC码流速度能达到94fps，是VTM11.0解码器的4.78倍。K2

2021-08-23 23:30:55 29741

原创 VVC的部署情况

本文来自JVET-w0021提案，该提案包括对VVC已部署的产品和服务、公开可用的软件源代码以及支持VVC标准的相关工具的调查。可公开获取的软件源代码VTM：VTM是JVET官方开发的参考软件，包含编码器和解码器。它主要是为了展示编码效率和解释标准中规定的语法和解码过程（不对速度进行优化）。VTM可以作为开发编码器的很好的基础，它使用BSD版权许可证。InterDigital开发了一个多线程的VTM解码器，并在2020年10月达到相当单线程参考软件6-10倍的加速比。它支持VTM的所有特性，该软

2021-08-22 09:44:25 30242

原创 ICASSP2021：通过码率限制降低ME复杂度

本文来自ICASSP2021《Relying on a Rate Constraint to Reduce Motion Estimation Complexity》运动估计ME是视频编码中最耗时的部分之一，本文提出基于码率的MV候选项消除策略。研究发现最优MV通常在MVP附近，通过限制MV的码率缩小运动搜索窗口从而减少计算复杂度。本文方法不局限于某种运动搜索模式，可以适用于各种ME策略。在VTM上实验结果显示和TZ search相比本文算法在BD-Rate损失0.74%的情况下可减少80%的复..

2021-08-18 22:44:13 30029

原创 ICASSP2021：基于显著性进行目标检测的VVC编码

本文来自ICASSP2021论文《SALIENCY-DRIVEN VERSATILE VIDEO CODING FOR NEURAL OBJECT DETECTION 》论文基于VVC提出了面向显著性的编码框架用于处理机器任务。为了在编码前获取显著性区域，论文使用YOLO进行目标检测。为了验证编码对于机器处理的效果，论文对解码图像使用Mask R-CNN进行目标分割。实验显示，使用本文算法在同样检测准确率下可以节省29%的码率。越来越多的视频不是面向人眼观看而是面向机器处理任务，通过计算机视..

2021-08-10 22:52:34 30858

原创 H266VVC电子书开放下载啦

千呼万唤始出来，历时八个多月终于完成了《最新通用视频编码标准H.266VVC》一书的第一版。在微信公众号Video Coding回复“266电子书”即可获取下载链接。

2021-08-04 09:20:37 31479

原创 ICME2021：基于机器视觉的RD模型

本文来自ICME2021论文《Visual Analysis Motivated Rate-Distortion Model for Image Coding》本文针对VVC帧内编码提出了一个面向视觉分析的RD模型，该模型包括码率控制策略和失真度量模型。首先提出了针对机器的ROI（ROIM）来度量不同CTU在视觉分析中的重要性。然后提出了基于ROIM和局部纹理特征的CTU级码率分配模型。提出多尺度特征失真（multi-scale feature distortion ，MSFD）来度量CU的失...

2021-08-02 23:08:27 31820

HM-16.18+SCM-8.7-4959.zip

2020-05-07

YUV Player Deluxe.zip

YUV播放器

2020-04-15

flvmeta-1.2.2.tar.gz

fpv解析器

2020-04-15

SDL2-2.0.12.zip

SDL2源码

2020-04-15

openHEVC-hevc_rext.zip

openHEVC源码

2020-04-10

FFmpeg-master.zip

ffmpeg源码

2020-04-10

itu-t81.pdf

INFORMATION TECHNOLOGY –DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES –REQUIREMENTS AND GUIDELINES

2020-03-06

vmaf-master.zip

vmaf主观评价

2019-11-21

x265.pdf视频编码

x265视频编码文档

2019-11-21

《高效音视频编码第1部分：视频》（GYT 299.1-2016）为广电行业标准.zip

《高效音视频编码第1部分：视频》（GY/T 299.1-2016）为广电行业标准

2019-08-07

ISO13818-1中文.pdf

ISO13818-1中文文档，有目录，ISO13818-1中文文档，有目录

2019-07-22

现代操作系统

《现代操作系统(英文版第3版)》内容为：Tanenbaum教授作为三个操作系统的设计师或联合设计师，具有长期设计开发操作系统的经验，从而把其对理论的深入理解和具体实践融入书中，使《现代操作系统(英文版第3版)》成为操作系统领域的经典之作。在《现代操作系统(英文版第3版)》第3版中，作者深入讨论了许多主题，包括：进程，线程，存储管理，文件系统，I／O死锁，接口设计，多媒体，性能权衡。以及有关操作系统设计的最新趋势。书中不仅涵盖了现代操作系统的原理和实践，而且特别关注了Linux操作系统，WindowsVista操作系统、嵌入式操作系统、实时操作系统以及多媒体操作系统。, ·涉及Windows Vista以及最新的Linux／Unix操作系统。, ·用一整章(第12章)的篇幅对用于移动设备的Syrnbian操作系统进行案例分析。, ·涵盖更多，更新的安全方面的内容。, ·重新组织内容，尽早论述关键抽象概念。, ·给出与未来操作系统发展有关的新研究成果。, ·更新和增加了编程练习。, ·在线操作系统练习(http：／／www prenhall．com／anenbaum／details．html)采用主流windows操作系统以及开源工具。, ·包括操作系统模拟练习。, , 海报：

2017-09-13