自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

鲲之大一锅炖不下

行之,记之。

  • 博客(4)
  • 收藏
  • 关注

原创 Keras函数集锦(收集贴……)

万丈高山,从平地走起Introto_categoricalrepeatdropoutin_train_phaseIntro这篇博文用于记录一些keras的函数用法和示例,以及部分函数的实现原理。方便自己查阅。因为原始keras的backend没法直接输出结果,所以这里我直接用的tf2.0,如果直接在keras中使用,去掉tensorflow就行啦。to_categori...

2019-12-09 11:38:07 277

翻译 声学似然度的计算

1. forward algorithm一个HMM的Acoustic likelihood可以用前向算法(forward algorithm)来计算。给定一个HMM模型MMM,一个特征向量序列o1,o2,...oTo_1,o_2,...o_To1​,o2​,...oT​,模型MMM能够生成OOO的似然度, 即声学似然度P(O∣M)P(O|M)P(O∣M)定义如下:(1)P(O∣M)=∑SP(O...

2018-10-20 17:04:46 691

原创 语言模型 (language model) 之n-gram LM

高山万丈,从平路走起语言模型是通过一个语音识别器来定义一系列的词的这么个东西。一些语言模型还会给每一个词序列一个权重或者概率,来当做这个词序列的language score,来彰显词序列的重要程度。有了语言模型,不符合语法规则或者看着就不像句子的输出就可以直接被排除掉,识别错误的情况也会大大减小。毕竟声学模型并不会考虑输出的像不像一句话,它只是听概率的话。今儿来总结下 n-gram la...

2018-10-19 22:35:28 4226 2

原创 中文语音识别(一) 数据准备

万丈高山,从平路走起。1. Create wav.scp, utt2spk.scp, spk2utt.scp, text1.1 创建 train,dev,test三个文件夹用来存储数据mkdir -p data/{train,dev,test}1.2 根据原始数据,生成标题中的文本,涉及到的一些指令总结下,主要是下面这句话中的:for nn in `find $corpus_dir...

2018-10-18 20:53:19 1585 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除