自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 kaldi学习之decoder与lattice

最新在学习怎么样将kaldi用在唤醒而不使用WSTF,所以需要深入kaldi进行学习。暂将学习内容整理一下。三张图片分别代表学习kaldi相关主题的学习笔记,仅写了对自己用用部分,要想搞得更细,还得靠时间和深扒源码和理论。1 Decoders used in kaldi Toolkit2 Online decoding in kaldi3 Lattices in kaldi...

2020-03-12 23:34:42 671

原创 HTK编译

本文介绍的是HTK在linux(centos)上的安装方式,其他方式在其他网页也可以搜到。1 到官网http://htk.eng.cam.ac.uk/注册,并下载相关安装包,如下:HTK-3.4.1.tar.gz;HTK-samples-3.4.1.tar.gz2 解压HTK-3.4.1.tar.gz,运行:cd htk./configure./congiure --pr...

2020-02-20 16:50:10 265 1

转载 学习工作之后的思考

优秀的话,简单概括一下可以这样:(1)硬实力三门本领:编程,数学,英语三类经历:科研/工程项目,竞赛,实习(技术类)——能有具体的成果如paper和可运行系统或实物等,就更好了(2)软实力三样品质:脚踏实地,自信坚强,锲而不舍三组能力:学习与实践,交流与合作,表达与展示开心的生活,未来也会开心的……...

2020-02-12 23:25:25 149

原创 kaldi学习之汇总

一、特有名词acoustic scale: 通常设置为0.1,意味着声学模型的log概率得到的权重远低于语言模型。在Score的脚本中,经常会看到一系列要搜索的语言模型权重(例如7到15的范围)。 这些可以解释为声acoustic scale的倒数; 这是两者对维特比解码很重要的比例alignment:表示一句话通过维特比(最佳路径)对齐的HMM状态序列表示,与transtions-id同...

2019-09-30 15:48:51 530

原创 pytorch之打印网络节点

1 输入:import torchthe_model = torch.load("model.pt")print (the_model)params=the_model.state_dict()len(params)for i, j in enumerate(params): print i, j2 输出:RNNModel( (drop): Dropout(...

2019-03-04 18:56:24 3160

原创 tensorflow之打印网络节点(名称)

1 测试代码: $ cat export_nodename.py#!/usr/bin/env pythonfrom __future__ import absolute_importfrom __future__ import divisionfrom __future__ import print_function#coding:utf-8 import tensorfl...

2019-02-22 14:39:06 7554 2

原创 python之json

1 处理对象为字符串时:>>> import json>>> data = {... 'name' : 'ACME',... 'shares' : 100,... 'price' : 542.23... }>>> >>> json_str = json.dumps(data)&gt...

2019-02-18 15:16:06 114

原创 centos安装 setuptools、pip、pip3,并安装相应版本tensorflow

1 setuptools下载:wget https://pypi.python.org/packages/6f/10/5398a054e63ce97921913052fde13ebf332a3a4104c50c4d7be9c465930e/setuptools-26.1.1.zip#md5=f81d3cc109b57b715d46d971737336db解压、安装:unzip ...

2018-12-24 10:49:54 481

转载 python之random

#1.使用python random模块的choice方法随机选择某个元素import randomfoo = ['a', 'b', 'c', 'd', 'e']from random import choiceprint choice(foo) #2.使用python random模块的sample函数从列表中随机选择一组元素list = [1, 2, 3, 4, 5, 6, 7...

2018-10-30 11:17:20 193 1

转载 神经网络的数据预处理

神经网络的数据预处理过程常用的集中预处理操作——1、去均值:最常见的数据处理操作。对待训练的每一张图片的特征,都减去全部训练集图片的特征均值,这么做的直观意义就是,我们把输入数据各个维度的数据都中心化到0了。2、归一化归一化的目的是保证所有的维度上数据都在一个变化幅度上。通常有两种方法可以实现归一化。一个是在数据都去均值之后,每个维度上的数据都除以这个维度上数据的标准差(X /= np....

2018-10-03 21:57:51 1206

原创 语言模型之平滑技术

注:本文主要介绍几种方法的个人理解,完全是白话,大神就不要来了。平滑技术核心思想就是“劫富济贫”,主要是解决数据稀疏(sparsity)问题,主要技术有三:discount,backoff,插值。一 discount1 add one (add x)假设此表包含n个词,就在分子和分母分别加上1和n2 good turning假设N元语法出现r次,那就它就按照比例缩小次数,溢出的概率根据开发集中未出...

2018-05-07 15:49:24 1617

原创 kaldi学习之神经网络简介

深度神经网络是语音识别里最先进的热点话题,从大概2010年左右开始,许多在这个领域的论文陆续发表,像谷歌、微软等大公司正在开始在他们的产品系统里使用DNNs。由于最新的技术持续改变意味着代码需要跟上,也意味着许多结构需要重新思考,所以对于活跃的研究领域,一个工具包比如kaldi,很难支持很好。在kaldi中,我们目前针对深度神经网络提供三种代码库。它们都很有意义,因为很难多recipe都参考它们。...

2018-04-25 13:36:31 1713

原创 kaldi的yesno样例分析

这篇文章是根据yesno样例下的run.sh脚本写出来的,当然脚本里还有许多附带工具暂时就来不及一一详解,看以后有没有时间和兴趣了。1.train_cmd="utils/run.pl"decode_cmd="utils/run.pl"定义机器运作方式,这里是本地多任务处理工作方式,而不是gpu.2. if [ ! -d waves_yesno ]; then wget http://www....

2018-04-03 15:20:10 1227

原创 pytorch的squeeze、cat函数

1 squeeze(): 去除size为1的维度,包括行和列。至于维度大于等于2时,squeeze()不起作用。行、例:>>> torch.rand(4, 1, 3)(0 ,.,.) = 0.5391 0.8523 0.9260(1 ,.,.) = 0.2507 0.9512 0.6578(2 ,.,.) = 0.7302 0.3531 0.9...

2018-03-23 09:50:11 13807

原创 kaldi中解码图的构建一

解码图谱建立概要解码图谱也就是我们构建的的:HCLG=H*C*L*G,这里        G是对语法或者语言模型编码的受体,它的输入和输出是一样的;        L是发音字典,它的输出是单词,输入是音素;        C代表语境相关性,它的输出是音素,输入符号代表上下文相关音素;        H包含了Hmm定义,它的输出符号代表上下文相关音素,输入符号是包含概率分布函数id和其他信息的状态转...

2018-03-06 17:31:06 2316

转载 linux下shell的if参数

文件表达式-e filename 如果 filename存在,则为真-d filename 如果 filename为目录,则为真 -f filename 如果 filename为常规文件,则为真-L filename 如果 filename为符号链接,则为真-r filename 如果 filename可读,则为真 -w filename 如果 filename可写,则为真

2018-02-07 10:30:47 215

原创 kaldi学习笔记一

前言kaldi和古老的HTK相似,是一套自动语音识别工具。kaldi的面向不在于初学者,而是在于expert或者expert-training,所以有一定的门槛,但是也不用害怕,github上有它的源码和egs,下载开源代码和egs,多多练习,一步一步的运行代码,看会发生什么,总会有所收获。kaldi虽然有一定的门槛,但是开发者也致力于提高代码的稳健性,可扩展性,尽量让代码结构清晰不太复杂

2018-01-23 20:29:34 873

原创 虚拟机下Ubuntu16.04安装搜狗输入法

1.Ubuntu上安装搜狗输入法一直是自己的心病,但是按照这篇博客步骤往下走,感觉很轻松,现贴出来链接:blog.csdn.net/qq_21792169/article/details/53152700,按照楼主的步骤,应该没有大问题,当然,中途打开language support时,如果报错运行:sudo apt-get install -f,再次打开language support,系统会继...

2018-01-22 14:02:44 2996

原创 matlab安装

转自:https://jingyan.baidu.com/article/eae07827a466a31fed548563.html(windows)安装很简单,主要注意两个问题:1 安装文件名为:Matlab R2015b,忽略2015后面的b,那只是版本号的问题,可能是我以前安装Matlab留下的错觉,以为还要一个a。2 就是最后一步替换破解动态链库的问题,不要提前看这个,按照安装步骤走到这一

2018-01-18 10:34:55 404

原创 word2vector

转自:http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/半路出家转到nlp领域(确切的说在语言模型组),在nlp不能不知道word2vector;对于这些高大上的领域确实挺好奇,加上它对于训练神经网络语言模型确实很重要(副产品),就催生了这篇文章。网上关于背景说了很多,这边就不再说了,主要是要了解一下on

2018-01-17 20:32:32 396 1

原创 安装python及其IDE

一、开场白:从高中毕业到现在,兜兜转转,已有八九年,一步一步走到现在,其中心酸有很多。可是既然决定走软件这条路,就一条道走到黑,不诉苦了。随着python越来越热,加上公司要用,决心以后就用这门语言了。这门语言主要特点在于简洁方便,内置类较多;主要用于编写一些小工具、爬虫、机器学习和科学计算。二、python的安装:       python现行有2.X和3.X两个版本。首先,从网上下载p

2017-04-21 23:37:12 351

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除