自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

do

  • 博客(19)
  • 资源 (1)
  • 收藏
  • 关注

原创 基于WS-PSNR权重的自适应QP算法对虚拟现实视频压缩率的优化

1.WS-PSNR权重ERP投影格式是将球面视频展开后所得的二维平面视频,该投影格式将其展开成与赤道区域等宽的一块矩阵图像。ERP(球状投影)投影权重分布图如下所示:颜色越深,权重越接近0;颜色越浅,权重越接近1。2.自适应QP补偿算法自适应QP补偿公式如下所示:在某次会议中,F0038号提案将cos(pi*y)作为w值代入,得到下式:由于360度虚拟现实视频中赤道与两极的夹角...

2021-11-09 16:50:11 414

原创 视频关键帧提取常用方法

4.2关键帧提取的常用方法4.2.1基于镜头的方法基于镜头的关键帧提取算法是视频检索领域中最先发展起来,也是目前最为成熟的一种通用方法,该算法的一般实现过程是:先按照某种技术手段把源视频文件按照镜头变化分割,然后在视频每个镜头中选择首、尾两帧作为关键帧。这种方法的优点是实施起来很简单,算法的计算量也很小,但是这种方法存在很大的局限性,当视频中内容变化剧烈、场景非常复杂时,选取镜头中的首、尾两帧...

2019-12-26 17:07:00 18729 1

原创 GAN(生成对抗网络) 解释

GAN (生成对抗网络)是近几年深度学习中一个比较热门的研究方向,它的变种有上千种。1.什么是GANGAN的英文全称是Generative Adversarial Network,中文名是生成对抗网络。它由两个部分组成,生成器和鉴别器(又称判别器),它们之间的关系可以用竞争或敌对关系来描述。我们可以拿捕食者与被捕食者之间的例子来类似说明两者之间的关系。在生物进化的过程中,被捕食者会慢慢演化自...

2019-12-20 11:40:57 13665

原创 简单解释:与HEVC及QP相关的量化值

1.简单概念量化就是把信号的连续取值映射成多个离散的幅值的过程,实现了信号取值多对一的映射。残差数据进过变换之后,变换系数具有较大的取值范围,量化可以有效减小信号的取值范围,进而获得更好的压缩效果,量化是造成失真的根本原因。2.最优量化值的选取对于同一个变换系数Ci,搭配多个可选的量化值li,1,li,2…li,k,并从中选取一个最优的量化值。对于式子中各参数的解释如下:3.量化值与...

2019-12-12 16:08:50 705

原创 WebGl几何对象的变换(附旋转正方形示例代码)

平移矩阵

2019-12-08 16:34:48 517

原创 WebGl编程初步——绘制简单三角形

var points = [];var NumTimesToSubdivide = 5;/* initial triangle */var vertices = [vec2( -1, -1 ),vec2( 0, 1 ),vec2( 1, -1 )];divideTriangle( vertices[0],vertices[1],vertices[2], NumTimesToSub...

2019-12-08 10:24:05 336

原创 自然场景下的文本识别——文本识别分类器详解

前言:在上一篇文章中,我们简单讲解了文本识别分类器之卷积神经网络(CNN)分类器,在这篇文章中,将从 文本识别分类器的结构,文本识别分类器的输入,以及 文本识别模块的设计 三个方面讲述。1.文本识别分类器的结构如上图所示,文本识别分类器由一个十层的卷积神经网络组成,其中包括一个输入层和一个输出层,中间八层分为四组,每一组由一个卷积层和一个Maxout激活函数层组成。Maxout激活函数有着如...

2019-12-07 10:26:55 2094

原创 谷歌街景中路牌、广告等标识文字的识别(文本识别在自然场景下的应用)之文本识别分类器

1.简介谷歌街景中的文本读取主要分为文本检测和文本识别。这两个模块各使用了一个训练好的CNN分类器用于字符的判断和识别。CNN基于字符训练数据集中的正样本和负样本,从中学习字符的特征表达,并训练形成最终的分类器。文本检测模块训练的是一个2元分类器,用于判别该CNN视野范围内是否包含文字,称为字符判断分类器;文本识别模块训练的是一个62元分类器(针对10个数字和52个大小写英文字母),识别该CN...

2019-12-06 11:29:37 1425

原创 Shazam音频指纹提取算法

在知网上搜索了Shazam算法,但是参考资料真是少之又少,而且感觉讲得并不是很明白,于是找到了一篇老外写的博客,大致整理了一下其中核心的算法思想部分。首先 附参考英文博客其次,开始讲解**(1)对于音乐文件加滑动窗,切分数据块。**滑动窗口只对一块原始信号进行傅里叶变换。数据块的大小可以通过多种方式确定。例如,我们录制了一段音乐,双声道,16-bit精度,44100Hz采样。这时1...

2019-11-14 20:15:08 6115 1

原创 python实现基于haar分类器的人脸识别技术

上一篇文章,我们介绍了基于Gabor特征提取算法的人脸识别技术,这篇文章作为上篇文章的延拓,我们将介绍基于haar分类器的人脸识别技术的python代码实现。这里就不详细介绍haar分类器了,引用了一篇大神的文章,供大家了解。一篇很详细的介绍haar分类器的文章引用了两个库文件“haarcascade_frontalface_default.xml”,“haarcascade_eye.xm...

2019-11-14 18:45:09 900

原创 人脸识别技术中的Gabor特征提取算法

前言上篇文章中,讲述了语音识别技术中的DTW算法,DTW算法是用于模板匹配的。这篇文章我们将介绍人脸识别中的Gabor特征提取算法,Gabor算法是用在特征提取阶段。我们在这里对比一下语音识别的流程图和人脸识别技术的流程图,以便学习总结。下图是基于DTW算法的语音识别技术的流程图:下图是基于Gabor特征提取算法和SVM分类器的人脸检测与识别流程图,其中包括测试过程与训练过程。Gabor...

2019-11-02 11:44:35 5820 1

原创 语音识别中的DTW(动态时间规整)算法

前段时间在做语音识别技术的研讨,通过对网上资料的学习,加上自己的一些理解,整理出一篇DTW算法简介,欢迎大家指出不足之处。DTW算法简介在进行语音帧对应关系的建立和总失真度的计算时,我们采用的是动态时间规整算法(DTW),该算法本质上是一种动态规划算法,利用局部最佳化的处理来寻找这样一条路径:沿着这条路径,两个特征矢量序列间的累积失真量最小,即是要寻找一条从起始点到终止点的最佳路径,使得该路径...

2019-11-01 17:05:20 1372

原创 POJ Radar Installation 1328(雷达)贪心算法

问题描述问题链接DescriptionAssume the coasting is an infinite straight line. Land is in one side of coasting, sea in the other. Each small island is a point locating in the sea side. And any radar installa...

2019-10-23 20:10:53 187

原创 POJ Raid 3714(最近点对)分治算法

题目描述原题链接After successive failures in the battles against the Union, the Empire retreated to its last stronghold. Depending on its powerful defense system, the Empire repelled the six waves of Union’...

2019-10-22 20:22:49 483

原创 POJ Common Subsequence 1458 (最长公共子序列)动态规划算法

问题描述原题链接A subsequence of a given sequence is the given sequence with some elements (possible none) left out. Given a sequence X = < x1, x2, …, xm > another sequence Z = < z1, z2, …, zk >...

2019-10-20 19:28:24 223

原创 POJ To the Max 1050 (矩阵求和)动态规划算法

问题描述原题链接Given a two-dimensional array of positive and negative integers, a sub-rectangle is any contiguous sub-array of size 1*1 or greater located within the whole array. The sum of a rectangle is ...

2019-10-18 10:51:43 126

原创 POJ Yogurt factory 2393(牛奶厂场)贪心算法

问题描述题目链接The cows have purchased a yogurt factory that makes world-famous Yucky Yogurt. Over the next N (1 <= N <= 10,000) weeks, the price of milk and labor will fluctuate weekly such that it...

2019-10-16 20:12:25 296

原创 Java实现跨平台视频播放器

如需要开发一个跨平台视频播放器,可以在不同的操作平台上播放多种格式的视频文件。对于这种多维度变化的系统,我们可以利用桥接模式提供一套完整的解决方案,降低系统复杂性。public abstract class OperatingSystemVersion { protected VideoFile videofile; public void setVideoFile(VideoFile v...

2019-10-15 19:48:30 2614

原创 无线通信信号的功率表示方法中dBm,dB与w的换算关系

无线通信信号常用的功率表示方法dBmdB换算dBmdBm是常用的功率单位,是一个表示功率绝对值的值,可以看成是以1mW功率为基准的一个比值P(dBm)=10log10(P/1mW)dBm和dBm之间只有加减,没有乘除;dBm减dBm实际上是两个功率相除;dBm加dBm 实际上是两个功率相乘。dB描述功率相对增益或插损或相对功率,表示一个相对值若有功率P1(输入)和P2(输出)...

2019-10-15 19:06:04 9749

大物B1期末模拟卷.pdf

东南大学大学物理期末考试模拟卷,是复习必备的参考资料。

2019-06-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除