2018年01月_岳麓吹雪

12月 11月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创深度学习5：TensorFlow MNIST入门示例

参考： http://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/mnist_pros.html今天按照官方教程来搭建一个MNIST的网络，同时学习一下构建一个TensorFlow模型的基本步骤。1. 单层网络MNIST是一个入门级的计算机视觉数据集，包含各种手写数字图片和对应的标签。在python中加载MNIST数据...

2018-01-30 19:39:22 1017 1

原创深度学习4：TensorFlow基础结构——Session，Variable，Placeholder，Optimizer

1.会话Session参考 http://blog.csdn.net/hanging_gardens/article/details/72784392 https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/ http://wiki.jikexueyuan.com/project/tensorflow-zh/t

2018-01-25 16:15:21 640

原创 H.266代码学习：SDT相关代码初步学习

之前在H.266变换编码：信号决定变换SDT中已经对SDT的理论进行了学习，下面来初步看下代码，之后会进行详细学习。SDT分为两部分： 1.训练KLT 2.对残差使用KLT第一部分训练KLT，帧内和帧间是独立处理的。帧内KLT对于帧内KLT，其训练部分是在xIntraCodingTUBlockTM中完成的。 xIntraCodingTUBlockTM详见https://b...

2018-01-25 11:31:19 865

原创深度学习3：TensorFlow第一个简单Demo

为了了解TensorFlow整体流程，学习一个简单的Demo，使用TensorFlow拟合最简单的线性函数：y=w∗x+b" role="presentation" style="position: relative;">y=w∗x+by=w∗x+by = w * x + b。输入为x和y，x为[0,1)的随机数，y=0.1∗x+0.3" role="present

2018-01-24 21:16:28 5338 1

原创深度学习2：概念学习

本人小白，记录一下几个深度学习的基础概念，本文会随学习不断补充。更新·2018.01.24 增加概念：1.深度学习是什么，2.人工智能、机器学习和深度学习的关系，3.神经元，4.神经网络。 ·2018.01.30 增加概念：5.ReLU神经元，6.池化Pooling，7.Dropout。 ·2018.03.01 增加概念：8.epoch、 iteration和batch size。...

2018-01-24 17:04:08 1627 1

原创 H.266代码学习：MDNSST相关代码初步学习

之前已经对MDNSST理论知识进行了学习，这里不再赘述，来看代码部分。 http://blog.csdn.net/lin453701006/article/details/79030862MDNSST是在主变换后进行处理，在transformNxN函数中，可以看到，经过xT主变换后会进行NSST变换，这里只分析其中MDNSST相关代码，为了便于阅读，省略其他代码。MDNSST主要流程如下： 1.

2018-01-24 10:52:32 1001

原创深度学习1：Window+TensorFlow

个人纯小白一个，今日开始，入坑深度学习。由于不熟悉linux平台，之前尝试过windows+caffe，这环境搭起来相当困难，错误百出，就放弃了，转用TensorFlow。虽然网上TensorFlow安装教程已经有很多了，但还是想记录下自己的学习过程，开启深度学习。本人使用的是win7+Anaconda3+TensorFlow-cpu推荐阅读http://blog.csdn.net

2018-01-23 10:00:06 678

最近一直在看变换部分的东西，由于很多变换模式是针对帧内预测模式设计的，来简单学习一下帧内预测流程。通过之前xCompressCU的学习，我们知道了帧内、帧间的入口函数都在xCompressCU中，下面回顾一下xCompressCU函数。xCompressCUxCompressCU主要作用是完成块划分，确定最优预测模式，其流程为： 1.帧间预测xCheckRDCostInter、xCheckRDCo

2018-01-22 17:53:16 3648 12

原创图像变换：可分变换和不可分变换

1.图像变换为了快速有效的对图像进行处理和分析，需要将图像从一个空间以某种形式变换到另一个空间，该变换操作即为图像变换。一般称原始图像为空间域图像，称变换后的图像为转换域图像，两者可以相互变换。图像变换根据是否可分，可以分为可分变换和不可分变换。 2.可分性下面以Fourier变换为例解释什么是可分性。在图像处理中，使用的是离散Fourier变换（DFT）对于2维的DFT，可以进行分解为两次1维的

2018-01-18 10:54:44 764

原创 Karhunen-Loève（KL）变换

KLT（Karhunen-Loève Transform）是建立在统计特性基础上的一种变换，有的文献也将KLT称为霍特林（Hotelling）变换（霍特林在1933年最先给出将离散信号变换成一串不相关系数的方法）。1. 定义以矢量信号X的协方差矩阵Ф的归一化正交特征矢量q所构成的正交矩阵Q，来对该矢量信号X做正交变换Y=QXY=QX，则称此变换为K-L变换（K-LT或KLT）。其中QTQ=IQ^TQ

2018-01-17 16:53:56 16031 2

原创 H.266代码学习：AMT相关代码学习

AMT理论部分见http://blog.csdn.net/lin453701006/article/details/79026631JEM中，AMT分为EMT和EMTFAST两种，在cfg中可以设定。CommonDef.h中定义了AMT的重要参数，默认AMT最大可用块尺寸为64。变换函数xTrMxN_EMTxTrMxN_EMT更详细的分析见 H.266代码学习：xT，xTrMx...

2018-01-16 10:23:20 1734

原创 HEVC代码学习36：xTrMxN函数

之前在transformNxN的学习中提到，xT函数是前向变换的入口函数，实际上xT完成的是变换前的准备工作，真正的前向变换由xTrMxN函数实现。先来看下xT函数。xT只是一个入口函数，首先定义了残差块和系数块，然后调用xTrMxN进行前向变换。/** Wrapper function between HM interface and core NxN forward transfo

2018-01-15 16:17:19 985

原创 HEVC代码学习36：transformNxN函数

今天来学习变换相关的函数，帧内帧间最终都会调用transformNxN来进行变换。下面来对transformNxN进行学习。其工作流程如下： 1.RDPCM，对残差进行PCM处理，利用周围临近残差值预测当前残差。 2.检测是否为Trans-quant-bypass模式，则直接使用RDPCM的残差。否则执行3。 3.Transform skip flag为真，调用xTransformSki

2018-01-15 11:55:30 1929

原创 H.266变换编码：信号决定变换SDT

SDT代码学习：http://blog.csdn.net/lin453701006/article/details/79158700在JEM中，变化编码的改进可以分为两个阶段，如下图。第一阶段是使用自适应多核变换AMT（http://blog.csdn.net/lin453701006/article/details/79026631）或信号决定变换SDT的主变换，两者通过率失真优化进...

2018-01-11 16:46:11 1445

原创 H.266变换编码：模式依赖的不可分二次变换MDNSST

MDNSST代码学习：http://blog.csdn.net/lin453701006/article/details/79148082在JEM中，变化编码的改进可以分为两个阶段，如下图。第一阶段是使用自适应多核变换AMT（http://blog.csdn.net/lin453701006/article/details/79026631）或信号决定变换SDT（http://blog

2018-01-11 11:40:10 1331 2

原创 H.266变换编码：自适应多核变换AMT

AMT代码学习：http://blog.csdn.net/lin453701006/article/details/79065885在JEM中，变化编码的改进可以分为两个阶段，如下图。第一阶段是使用自适应多核变换AMT或信号决定变换SDT（http://blog.csdn.net/lin453701006/article/details/79035202）的主变换，两者通过率失真优化进

2018-01-10 17:47:11 3094 2

原创 H.266变换编码：高频调零的大尺寸块变换

在JEM中，使用了更大尺寸的变换块，最高可达128x128，主要针对1080p和4K的更高分辨率视频。通过对宽或高或宽高同时大于阈值的大变换块中的高频变换系数进行调零处理，获取更优的变换性能。首先来看下变换编码。视频信号中包含着能量上占大部分的直流和低频成分（图像的平坦部分），还有少量的高频成分（图像的细节部分）。变换编码是通过将空间信号的能力集中到频域的一小部分低频系数上，能量小的系数可通过

2018-01-10 15:42:36 867

原创 H.266帧间预测：双向光流BIO

双向光流（BIO）是采样点级别的运动优化，基于双向预测的块运动补偿，不需要传输多余信号。令I(k)I^{(k)}为参考点k（k=0,1）运动补偿之后的亮度值，∂I(k)/∂x，∂I(k)/∂y∂I^{(k)}/∂x，∂I^{(k)}/∂y为I(k)I^{(k)}的梯度水平分量和垂直分量。假设光流可用，运动矢量(vx,vy)(v_x,v_y)可以如下得到，该式称为光流公式：将光流公式和Hermit

2018-01-09 16:55:59 3715

原创刷题笔记：C/C++专项练习8

题目：下面有关虚函数的描述，说法错误的是？A.虚函数的作用是实现了继承性 B.虚函数的作用就是实现“动态联编”，也就是在程序的运行阶段动态地选择合适的成员函数 C.和类的静态成员函数与非类的成员函数相比，虚函数的效率较低 D.要正确的实现虚函数，只能用一个基类的指针或者引用来指向派生类对象答案：A 知识点：虚函数解析：虚函数实现了多态，而不是继承性，要实现多态必须满

2018-01-04 22:03:01 723

原创 H.266帧间预测：模板匹配的运动矢量推导

在JEM中，引入了一种特殊merge模式——帧率上变换FRUC模式。该模式下块的运动信息不需要传输，在解码器端直接推到得到。FRUC模式分为双边匹配模式和模板匹配模式。当merge flag为真的时候，会为CU传输FRUC flag。当FRUC flag是假时，使用正常merge模式并传输merge索引。当FRUC flag为真的时候，一个额外的FRUC模式flag被传输来表示使用双边匹配还是

2018-01-04 21:43:44 4359

原创 H.266帧间预测：仿射运动预测

在HEVC中，只有平动模型被用于运动补偿预测。然而在真实世界中，有各种各样的运动，比如放大/缩小，旋转，透视运动和其他非规则运动。JEM中简化的仿射运动补偿预测在JEM中，使用了一个简化的仿射运动补偿预测。如下图所示，一个块的仿射运动域由两个运动矢量表示。一个块的运动矢量域（MVF）表示如下：其中(v0x,v0y)(v_{0x},v_{0y})是左上中心控制点的运动矢量，(v1x,v1y

2018-01-04 11:41:32 5241

原创 H.266帧间预测：局部光照补偿（LIC）

在HEVC中，已经采用了全局光照补偿加权预测。JEM中加入了局部光照补偿（LIC），是一种基于光照变换的线性模型，使用一个放缩系数a和一个偏移量b。能够自适应的根据每个帧间模式的CU选择是否使用。 Pneigh=a∗Pref+b→a,bP_{neigh}=a*P_{ref}+b→a,b 其中PneighP_{neigh}为当前图像中当前CU的邻近采样点，PrefP_{ref}为参考图像中对应的邻

2018-01-03 21:44:01 1873 6

原创 H.266帧间预测：重叠块运动补偿（OBMC）

重叠块运动补偿（OBMC）曾在H.263中被使用过。目前HEVC采用的是基于块的运动估计和补偿技术，当运动矢量不准确、物体不是简单的平移运动或一个分块中包含多个运动物体时，就容易出现方块效应。采用OBMC可以对块边缘进行处理，可以减少方块效应。不像H.263，在JEM中可以使用CU级语法来控制OBMC的开关。JEM中，OBMC被用于除CU的右侧和底部边缘的所有运动补偿MC块边缘。另外，OBMC不仅被

2018-01-03 16:17:34 4675

原创 H.266帧间预测：自适应运动矢量残差分辨率和更高运动矢量存储精度

在HEVC中，运动矢量残差（MVD）单位由use_integer_mv_flag控制，当flag为0，MVD以1/4像素亮度采样为单位编码传输。在JEM中，引入了一个局部自适应运动矢量分辨率（LAMVR），MVD分辨率可以在CU级别进行控制，每个有非零MVD分量的CU都有MVD分辨率flag，控制MVD以1/4、整数或4的倍数的亮度采样为单位进行编码。注意：以下为简略，所有的MVD分辨率为亮度分量M

2018-01-02 21:55:46 1925

原创 H.266帧间预测：亚CU级运动预测

JEM使用了QTBT结构，没有了CU、PU、TU界限，一个CU每个预测方向最多有一组运动参数。在编码器端通过将大块CU划分为子CU并派生得到子CU运动信息，可以有两种亚CU级别的运动矢量预测模式： 1.可选时域运动矢量预测（Alternative temporal motion vector prediction，ATMVP）—— 并置参考图像中，ATMVP方法允许每个CU可以从多个小于当前CU

2018-01-02 19:13:54 2588 1