自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

风口上的传奇

算法学习

  • 博客(15)
  • 资源 (1)
  • 收藏
  • 关注

原创 webrtc服务器janus通信方法学习二

官方链接:https://janus.conf.meetecho.com/docs/rest.html网关部署了一个客户端可以利用的接口。这个janus.js库以透明的方式使用它,其中与之交流的接口都封装好了,也可以自己使用其他方式进行通信,我不使用js接口与之通信,我使用window socket进行,下面描述了API暴露的接口和协议,使用。1.The gateway root (/ja...

2018-06-29 16:23:30 4912 1

原创 VS2015开发Linux程序(VisualGDB)

因为我的代码是在ubuntu上面,我这次尝试直接在linux上调试,即使用vs2015工具使用ubuntu上面的代码与依赖库。 https://visualgdb.com/tutorials/linux/directssh/ 官方的教程。 因为需要使用安装VisualGDB-5.3以上。我使用的是VisualGDB-5.3新建工程 使用cmake建立工程,只有此选项下面才能支持直...

2018-06-28 11:20:23 2699

原创 语音识别算法原理文档整理(九)

数据文件内容简介数据准备阶段的输出包含两部分。一部分与―数据相关(保存在诸如data/train/之类的目录下),另一部分则与语言相关(保存在诸如data/lang/之类的目录下)。 数据部分与数据集的录音相关,而―语言部分则与语言本身更相关的内容,例如发音字典、音素集合以及其他Kaldi需要的关于音素的额外信息。如果你想用已有的识别系统和语言模型对你的数据进行解码,那么你只需要重写―数据部分...

2018-06-23 21:25:48 2098

原创 语音识别算法原理文档整理(八)

2.工程定稿运行脚本前的最后一章, 你的工程将会变得完整。 2.1.工具附件 你需要添加在例子脚本中广泛使用的 kaldi 工具箱。 任务: 在 kaldi-trunk/egs/wsj/s5 目录下拷贝出两个文件夹(注意拷贝所有内容):‘utils’和‘steps’,并把它们放在你的/home/hujianhua/kaldi/egs/thchs30/s5目录下。你还可以为你的这些目录建立...

2018-06-23 21:14:23 812

原创 语音识别算法原理文档整理(七)

如何使用kaldi系统Kaldi运行流程前提: 你已经有了一定数量的包含不同说话人的的数字音频数据, 每一个音频文件是一个完整的句子。我们以清华30小时为例。 目的: 你想把你的音频数据分成训练部分和测试部分,搭建一个ASR系统并且对它进行训练和测试,得到一些解码结果。 首要任务:首先在 kaldi/egs/目录下创建一个名为 thchs30/s5 的文件夹,这是你存放有关你工程的...

2018-06-23 20:38:00 2421

转载 语音识别算法原理文档整理(六)

Viterbi算法(解码)解码的过程就是在给定声学特征的情况下,找到最可能对应的词组的过程,再次看如下求解目的的公式: 其中似然概率是在一系列给定声学frame情况下,计算每个对应的分类器得分,然后相乘得出的概率,使得其值变得很小,而P(W)比较大,这样就导致 P(w)权重太大了,所以需要对齐进行缩放,以平衡贡献值,所以把上面公式改写如下: 因为P(w)小于1,使LMSF大于...

2018-06-23 20:27:24 3218

转载 语音识别算法原理文档整理(五)

HMM算法隐马尔可夫模型的参数一般称为其三要素,包括初始状态概率,转移概率和观测概率。 三个主流算法: 概率计算问题即模型评价问题——前向算法和后向算法 学习问题即参数估计问题——Baum-Welch算法 预测问题即解码问题——Viterbi算法前向算法与后向算法首先引入前向变量αt(i):在时间t时刻,HMM输出序列为O1O2…OT,在第t时刻位于状态si的概率。 ...

2018-06-22 20:43:22 1057

转载 语音识别算法原理文档整理(四)

GMM算法1. GMM模型:样本数据x,该数据是有k个高斯混合产生的,每个 GMM 由 K 个 Gaussian 分布组成,每个 Gaussian 称为一个“Component”,这些 Component 线性加成在一起就组成了 GMM 的概率密度函数: 根据上面的式子,如果我们要从 GMM 的分布中随机地取一个点的话,实际上可以分为两步:首先随机地在这 K个Gaussian ...

2018-06-22 20:31:19 2480 3

转载 语音识别算法原理文档整理(三)

语音识别系统kaldi相关原理介绍Kaldi是一个非常强大的语音识别工具库,主要由Daniel Povey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。其中DNN-HMM中的神经网络还可以由配置文件自定义,DNN、CNN、TDNN、LSTM以及Bidirectional-LSTM等神经网络结构均可支持。 目前在Github上这个...

2018-06-22 20:21:57 2656

转载 语音识别算法原理文档整理(二)

隐马尔可夫模型hmm隐马尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。 例如我们可能得到这么一串数字(掷骰子10次):1 6 3 5 2 7 3 5 2 4 这串数字叫做可见状态链。但是在隐马尔可夫模型中,我们不仅仅有这么一串...

2018-06-22 20:17:49 2726

原创 语音识别算法原理文档整理(一)

MFCC提取过程声音是模拟信号,声音的时域波形只代表声压随时间变化的关系,不能很好的代表声音的特征,因此,必须将声音波形转换为声学特征向量。目前有许多声音特征提取方法,如梅尔频率倒谱系数MFCC、线性预测倒谱系数LPCC、多媒体内容描述接口MPEG7等,其中MFCC是基于倒谱的,更符合人的听觉原理,因而是最普遍、最有效的声音特征提取算法。在提取MFCC前,需要对声音做前期处理,包括模数转换、预...

2018-06-22 20:11:03 29868 3

原创 webrtc服务器janus echotest学习一

代码分析 在janus = new Janus()时,调用Janus(gatewayCallbacks)在其中有函数createSession createSession创建请求,成功建立一次httpAPICall,输出Created handle: 1747107217737787 Janus.httpAPICall(server, { verb: ‘POST’, ...

2018-06-20 15:21:04 3151

原创 coturn穿透服务器安装方法

coturn穿透服务器安装方法前面章节我们介绍了webrtc服务器janus的安装,如果网络无法穿透的时候就需要 turn 服务器来保证视频通话的成功率。turn 包含了stun的功能,所以只需要部署turn服务器即可。下载编译安装coturngit clone https://github.com/coturn/coturn cd coturn ./configure ma...

2018-06-20 10:13:25 13969 22

原创 NanoPi NEO开发板使用方法

烧写系统镜像下载Ubuntu-Core with Qt-Embedded系统映像和烧写系统 官方提供的百度网盘地址:https://pan.baidu.com/s/1miMwKoK#list/path=%2F 先将NanoPi-NEO\official-ROMs\nanopi-neo-core-qte-sd4g-20160704.img.zip解压得到映像文件。以管理员身份运行tools目...

2018-06-12 16:07:04 5310

原创 webrtc开源服务器janus安装

依赖库编译运行 Janus Server 需要依赖较多的一些第三方库,而这些依赖库在 Ubuntu 下主要通过 aptitude 进行安装,首先通过安装 aptitude: sudo apt-get install aptitude安装依赖库: sudo aptitude install libmicrohttpd-dev libjansson-dev libnice-dev sud...

2018-06-11 10:39:20 8878 6

python实现yuv转RGB图片程序

python实现yuv转RGB图片程序,更多说明访问我的博客https://blog.csdn.net/bvngh3247

2018-11-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除