自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 CrossWord of AM training

General Framework for Acoustic ModelingBuilding ASR system incrementallyContext-independent ➔ Context-dependent modelingMono-phone ➔ Tri-phone HMMSingle Gaussian mixture per state ➔

2017-08-19 19:44:07 315

原创 声学模型训练----Acoustic Modeling

General Framework for AM:Building ASR system incrementallyContext-independent ➔ Context-dependent modelingMono-phone ➔ Tri-phone HMMSingle Gaussian mixture per state ➔ Multiple Gaussian mixtur

2017-08-19 18:45:07 1078

原创 ASR---自动语音识别 概述

语音识别基本原理:观察矢量X=X1X2…Xn词序列W=W1W2…Wm 最优词序列W^  P(X|W): 声学模型描述了词W产生的情况下信号X的概率。P(W): 语言模型描述了词W出现的频率概率分布P(X|W)和P(W)被假设成某种已知的概率分布函数Pa(X|W)和Pb(W):概率分布函数中的参数集a和b通过统计学的方法从实际训练数据中估计得到

2017-08-19 18:31:50 2120

原创 传统神经网络

线性回归:线性关系描述输入输出的关系。方程:y=ax1+bx2+cx3+d   参数:m=[a,b,c,d]    数据为矩阵:(x1,1; x2,1; x3,1) , (x1,2; x2,2; x3,2)......                      目标:使预测值尽可能的接近真实值。优化方法:梯度下降法求线性回归的最优解  当前初始状态:m0 = [a0,

2017-07-16 16:43:12 542

原创 深度学习基础介绍

深度学习基础框架图:深度学习的发展历程:深度学习的优点:学习能力强;适应性好;可移植性好。缺点:计算量大,便携性能差;硬件要求高;模型设计复杂;善于计算,但是不会算计。深度学习各框架的比较:基本概念:神经元边界算子卷积核--CNN

2017-07-16 16:05:32 485

转载 交叉熵基本概念

语言模型的性能通常用交叉熵和复杂度(perplexity)来衡量。交叉熵的意义是用该模型对文本识别的难度,或者从压缩的角度来看,每个词平均要用几个位来编码。复杂度的意义是用该模型表示这一文本平均的分支数,其倒数可视为每个词的平均概率。平滑是指对没观察到的N元组合赋予一个概率值,以保证词序列总能通过语言模型得到一个概率值。通常使用的平滑技术有图灵估计、删除插值平滑、Katz平滑和Kneser-Ney

2017-07-16 09:21:23 2868

原创 自然语言处理(二)

神经序列模型:机器学习:优化目标函数:初始化参数计算偏导数更新参数更新learning rate,直至收敛Batch Gradient Descent 梯度下降法:稳定可靠,更新速度慢。必须遍历所有的训练数据求偏导数,才能更新一次参数。Stochastic Gra

2017-07-14 18:35:22 372

原创 自然语言处理(一)

概论自然语言处理----利用计算机处理文本及声音。应用领域:输入—输出;输入法; 拼写更正;机器翻译;evernote推荐系统; 英文写作助手;twitter重大事件分析;医疗诊断;体育赛事报道生成;应用技术:语言模型,自动机,中文分词,文本对齐,模板匹配,分类器,相似度计算,local sensitive hashing,文本分类,关键词匹配,

2017-07-14 18:33:23 1850

原创 语音基础知识

语音识别原理:语音识别的最终目的是让机器听懂人的语言。语音信号通过麦克风采集,经过采样和 A/D 转换后由模拟信号转变为数字信号。然后对语音的数字信号进行预加重,分帧,加窗,端点检测和滤波等处理。预处理过后的语音信号将按照特定的特征提取方法 取出最能够表现这段语 音信号特征的参数,这些特征参数按时间序列构成了这段语音信号的特征

2017-07-14 18:29:31 621

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除