神遁克里苏-CSDN博客

DQ反量化时，会把初始状态设置为0，然后根据level（也就是k）来进行下个点的state判断，如下图所示：反DQ的函数是dequantBlock函数，个人理解见注释：void Quantizer::dequantBlock( const TransformUnit& tu, const ComponentID compID, const QpParam& cQP, CoeffBuf& recCoeff, bool enableScalingLists, int* piDequ

2021-06-05 15:47:12 510

原创【VTM10.0】量化之一般量化技术

量化公式：其中：函数是quant函数，个人理解见注释：void Quant::quant(TransformUnit &tu, const ComponentID &compID, const CCoeffBuf &pSrc, TCoeff &uiAbsSum, const QpParam &cQP, const Ctx& ctx){ const SPS &sps = *tu.cs->sps; const

2021-06-05 15:22:22 705

原创【VTM10.0】反量化之RDOQ、一般量化

RDOQ与一般量化的过程虽然不同，但是解码的步骤时在相同的，如下：解码都调用的dequant函数：该函数主要完成写下面的公式，进行反量化。void Quant::dequant(const TransformUnit &tu, CoeffBuf &dstCoeff, const ComponentID &compID,

2021-06-05 11:57:56 508 1

原创【VTM10.0】量化之RDOQ技术

其中第一步的量化与普通量化相同，步骤如下：代码理解见注释（仅个人理解，欢迎指正）：void QuantRDOQ::xRateDistOptQuant(TransformUnit &tu, const ComponentID &compID, const CCoeffBuf &pSrc, TCoeff &uiAbsSum, const QpParam &cQP, const Ctx &ctx){ const FracBitsAccess&..

2021-06-05 11:44:40 614

原创【VTM10.0】反量化反变换技术

void TrQuant::invTransformNxN( TransformUnit &tu, const ComponentID &compID, PelBuf &pResi, const QpParam &cQP ){//反量化与反变换 const CompArea &area = tu.blocks[compID]; const uint32_t uiWidth = area.width; const uint32_t uiHe

2021-05-15 11:42:57 517 3

原创【VTM10.0】熵编码技术

CABAC编码template <class BinProbModel>void TBinEncoder<BinProbModel>::encodeBin( unsigned bin, unsigned ctxId ){ BinCounter::addCtx( ctxId ); BinProbModel& rcProbModel = m_Ctx[ctxId]; uint32_t LPS = rcProbModel.getLPS( m

2021-05-14 20:53:19 278

原创【VTM10.0】帧内之MIP技术

MIP （Matrix weighted Intra Prediction，基于矩阵的帧内预测）矩阵：根据不同块大小，分别预先训练出不同的多组矩阵，存在ROM中；向量：将参考像素的一部分进行一些处理，排成一维向量；通过矩阵与向量相乘进行帧内预测，得到当前块的预测值。其预测过程可以分为三步，以大小为8 x 8的CU为例：ROM中矩阵规模为[16 x 8]，待输入向量规模为[8 x 1]，经过矩阵相乘后得到16个预测值。MIP初始化代码：void IntraPrediction::initIn

2021-05-13 20:34:15 350 1

原创【VTM10.0】xPredIntraAng函数解析

xPredIntraAng函数内进行角度模式的解析，获取块内的预测值。void IntraPrediction::xPredIntraAng( const CPelBuf &pSrc, PelBuf &pDst, const ChannelType channelType, const ClpRng& clpRng){ int width =int(pDst.width); int height=int(pDst.height); const bool bIsMod

2021-05-13 20:21:00 413

原创【VTM10.0】predIntraAng函数解析

void IntraPrediction::predIntraAng( const ComponentID compId, PelBuf &piPred, const PredictionUnit &pu){ const ComponentID compID = MAP_CHROMA( compId ); const ChannelType channelType = toChannelType( compID ); const int

2021-05-13 20:18:12 208

原创【VTM010.0】xIntraRecBlk函数解析

本函数完成了重建值的生成。1.获取当前块的pred2.反量化反变换得到resi3.resi+pred=recovoid DecCu::xIntraRecBlk( TransformUnit& tu, const ComponentID compID ){ if( !tu.blocks[ compID ].valid() ) {//如果当前的tu块是无效的，则返回 return; } CodingStructure &cs = *tu.cs;

2021-05-13 20:10:21 287

原创【VTM10.0】帧内之DM技术

色度只有8种候选模式：横轴是色度块所对应的亮度块的预测方向，纵轴是当前色度块的候选预测模式。冗余性检验: 如列表前面出现过DM的模式，则用66取代列表前面的重复模式以免在RDcost的时候和DM模式重复，最后选取RDcost最小的一种角度模式，即可最终确定色度角度预测模式。DM模式：找到当前色度CU位置对应的亮度CU位置，将其中心块的预测模式作为DM候选模式。uint32_t PU::getFinalIntraMode( const PredictionUnit &pu, cons

2021-05-12 19:46:51 316 1

原创【VTM10.0】帧内之CCLM技术

为了减少分量间的冗余，提出分量间线性模型预测技术，基本思想是假设亮度分量和色度分量间存在某种线性关系，根据此线性关系实现亮度分量到色度分量的预测。VVC中CCLM步骤如下：1.使用特定位置的四个点。对同位亮度块的上述4个位置以及块内的所有亮度样本进行下采样以获得和色度样本一一对应的亮度样本。以CCLM为例：VTM10.0亮度下采样的代码：用于生成包括参考像素和块内像素的下采样亮度值。// LumaRecPixels 获得亮度的重建值void IntraPrediction

2021-05-12 19:30:02 422

原创【VTM10.0】帧内之ISP技术

ISP（Intra Sub-Partitions，帧内子区域划分）依据CU的亮度块尺寸，将其沿水平或垂直方向划分成2个或者4个尺寸相同的子块，然后逐个子区域进行预测和重建。进行帧内ISP的最小CU尺寸为4 x 8或8 x 4（即4 x 4的CU不使用ISP），4 x 8或8 x 4的CU会被分成2个子区域，其他尺寸则被分成4个子区域，即每个子区域最少需要有16个像素。代码意思见注释void IntraPrediction::initIntraPatternChTypeISP(const Codi

2021-05-08 21:09:30 1560 4

原创【VTM10.0】帧内之PDPC技术

PDPC （Position dependent intra prediction combination）一种对预测值的修正的技术。部分帧内模式在进行帧内预测之后，进行PDPC的加权平均计算，得到最终预测值。分为以下三种情况处理：Planar/DCHor/Ver角度模式 2~17 和 51~66（代码里好像所有角度都用了？？m_ipaParam.applyPDPC &= m_ipaParam.angularScale >= 0;这一句是什么意思？？是只有 2~17 和 5

2021-05-07 21:09:26 688

原创【维特比算法】简单易懂讲解

最近看了一下维特比算法，是一种典型的动态规划算法。概念定义就不多说了，直接进入正题。对这样一个最短路径的问题，如何去求解？暴力法当然可以找到答案，但是很复杂，所以这个时候我们就要使用维特比算法了自己画了一张假设要从A到D，我们是不是一定会经过t2和t3时刻，就是一定会经过B和C,只不过现在要求的最短的路径经过的是哪一个B和C。我们可以分时刻来求解，对于t2时刻，是不是可以求出每个B的最短路径。t2时刻比如对于B1，到达B1的最短路径为5，记做L(B1)=5到达B2的最短路径L(B2)

2021-03-20 11:03:07 638 1

原创 H5文件读取

H5文件读取：import torch.utils.data as dataimport torchimport h5pyclass DatasetFromHdf5(data.Dataset): def __init__(self, file_path): super(DatasetFromHdf5, self).__init__() hf = h5py.File(file_path) self.data = hf.get('data')

2021-01-16 11:44:11 2023

原创 python对yuv图像裁剪

首先读取yuv图像，从图像的命名中读出图像的长和宽，可能要跟你的yuv文件命名方式来做修改。这是我的yuv图像的命名方式。达到长和宽之后就可以读取图像的像素值了，我这里设置的是裁剪成40的倍数，这两句是得到裁剪后的长和宽。 Height_Y = Height_Y // cropc * cropc Width_Y = Width_Y // cropc * cropc裁剪 current_Y = Y[0:Height_Y, 0: Width_Y ] current_U = U[

2021-01-16 11:20:57 827

原创 Python计算yuv图像PSNR

计算PSNR计算PSNR函数：def PSNR(pred, gt,height,width): pred = np.array(pred) gt = np.array(gt) pred=pred.reshape(-1,height* width) gt = gt.reshape(-1, height* width) res = np.mean((pred - gt) ** 2, axis=1) res=res.reshape(-1,1) res=

2021-01-16 10:59:28 1365

原创三个list分量合成YUV文件

把list类型存储的Y、U、V分量合成一张yuv文件。这里output_Y，output_U，output_V是三个list类型的列表。'I:/png/123.yuv’是这个yuv图像存放的位置。with open('I:/png/123.yuv'','wb+') as fp: fp.write(np.array(output_Y, dtype=np.uint8).tobytes()) fp.write(np.array(output_U, dtype=np.uint8).tobytes(

2021-01-10 13:34:04 393

原创 yuv图像分量list读取

读取YUV文件，三个分量Y，U，V分别放在list类型的YUV[0]、YUV[1] 和YUV[2]中YUV = [[],[],[]]fp1 = open('I:/png/1/' + 'f' + str(1).zfill(3) + '.yuv', 'rb')YUV[0] = list(np.frombuffer(fp1.read(Height_Y * Width_Y * 2//2), np.uint8).reshape((Height_Y*Width_Y)))YUV[1] = list(np.from

2021-01-10 13:24:05 346

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

cesh代码使用，加入新方案

SRGAN-ImageNet训练集

SRGAN预训练模型下载

vmaf-2.3.1.zip

vmaf-v0.6.1.json

SRCNN数据集，包括91-image，set5，set14

玉米生长状态数据集(健康及病害)

空空如也