《正版 图解语音识别 语音识别入门实践教程 语音识别技术书 人工智能机器学习深度学习计算机网络编程书籍R3Z978》[日]荒木雅弘著【摘要 书评 在线阅读】-苏宁易购图书...

11903802361.html

商品参数

图解语音识别

11903802361.html 定价 59.00

出版社 人民邮电出版社

版次 1

出版时间 2020年04月

开本 32开

作者 [日]荒木雅弘

装帧 平装-胶订

页数

字数

ISBN编码 9787115528711

重量

11903802361.html

内容介绍

本书从语音识别的历史和基础知识讲起,通过图解的方式对语音识别技术进行了尽可能简单的解释。内容涉及语音学基础知识、统计模式识别、有限状态自动机、语音特征的提取、声学模型和语言模型、搜索算法和基于WFST 的语音识别技术等。 此外,本书没有将语音识别限定在“将语音转换成文本”的传统范畴内,而是在此基础上,还讲解了从语音识别技术到人机对话技术的演进过程和方法。内容涉及语义分析和语音对话系统的实现。

11903802361.html

目录

目录

第 1章 开篇

1.1 什么是语音识别 2

1.2 语音识别的历史 4

1.3 语音识别的用处 6

1.4 为什么很难 8

1.5 本书的目标 10

1.6 小结 12

第 2章 什么是语音

2.1 语音学 16

2.2 声音是如何产生的——发音语音学 16

2.3 声音的真面目——声学语音学 23

2.4 声音是如何被感知的——感知语音学 29

2.5 总结 32

第3章 统计模式识别

3.1 什么是模式识别 34

3.2 统计模式识别的思路 36

3.3 生成模型的训练 40

3.4 判别模型的训练 44

3.5 统计语音识别的概要 45

3.6 总结 48

第4章 有限状态自动机

4.1 什么是有限状态自动机 50

4.2 用有限状态自动机表达的语言 53

4.3 各种各样的有限状态自动机 55

4.4 有限状态自动机的性质 58

4.5 总结 59

第5章 语音特征的提取

5.1 特征提取的步骤 62

5.2 语音信号的数字化 64

5.3 人类听觉模拟——频谱分析 67

5.4 另一个精巧设计——倒谱分析 69

5.5 噪声去除 72

5.6 总结 73

第6章 语音识别:基本声学模型

6.1 声学模型的单位 76

6.2 什么是隐马尔可夫模型 78

6.3 隐马尔可夫模型的概率计算 81

6.4 状态序列的估计 83

6.5 参数训练 85

6.6 总结 89

第7章 语音识别:高ji声学模型

7.1 实际的声学模型 92

7.2 判别训练 94

7.3 深度学习 96

7.4 总结 98

第8章 语音识别:语言模型

8.1 基于语法规则的语言模型 100

8.2 统计语言模型的思路 101

8.3 统计语言模型的建立方法 103

8.4 总结 108

第9章 语音识别:搜索算法

9.1 填补声学模型和语言模型之间的空隙 112

9.2 状态空间搜索 113

9.3 用树形字典减少浪费 115

9.4 用集束搜索缩小范围 116

9.5 用多次搜索提高精度 118

9.6 总结 120

第 10章 语音识别:WFST运算

10.1 WFST的合成运算 124

10.2 确定化 129

10.3 权重移动 133

10.4 *小化 134

10.5 总结 135

第 11章 语音识别:使用 WFST进行语音识别

11.1 WFST转换 138

11.2 声学模型的 WFST转换 139

11.3 发音字典的 WFST转换 141

11.4 语言模型的 WFST转换 142

11.5 WFST的搜索 144

11.6 总结 145

第 12章 语义分析

12.1 什么是语义表示 148

12.2 基于规则的语义分析处理 151

12.3 基于统计的语义分析处理 153

12.4 智能手机的语音服务 156

12.5 总结 159

第 13章 语音对话系统的实现

13.1 对话系统的开发方法 162

13.2 基于规则的对话管理 164

13.3 针对对话管理的统计方法 166

13.4 总结 170

第 14章 终篇

14.1 语音分析工具 WaveSurfer 174

14.2 HMM构建工具 HTK 175

14.3 大词汇量连续语音识别引擎 Julius 177

14.4 虚拟代理对话工具 MMDAgent 179

14.5 深入学习之路 180

思考题的解答 182

参考文献 188

后 记 191

显示全部信息

程序 = 数据结构 + 算法  程序是为了解决实际问题而存在的。然而为了解决问题,必定会使用到某些数据结构以及设计一个解决这种数据结构的算法。如果说各种编程语言是程序员的招式,那么数据结构和算法就相当于程序员的内功。编程实战算法,不是念PPT,我们讲的就是实战与代码实现与企业应用。程序 = 数据结构 + 算法                ——图灵奖得主,计算机科学家N.Wirth(沃斯)作为程序员,我们做机器学习也好,做python开发也好,java开发也好。有一种对所有程序员无一例外的刚需 —— 算法与数据结构常增删改查 + 粘贴复制 + 搜索引擎可以实现很多东西。同样,这样也是没有任何竞争力的。我们只可以粘贴复制相似度极高的功能,稍复杂的逻辑没有任何办法。语言有很多,开发框架更是新月异3个月不学就落后我们可以学习很多语言,很多框架,但招聘不会考你用5种语言10种框架实现同一个功能。真正让程序员有区分度,企业招聘万年不变的重点 —— 算法与数据结构。算法代表程序员水平的珠穆朗玛。 本视频由微软全球最有价值专家尹成录制,拒绝念PPT,代码实战数据结构与算法导论。除了传统数据结构算法,加入高并发线程安全数据结构,分布式负载均衡算法,分布式哈希表,分布式排序等等现代算法。  算法,晦涩难懂,却又是IT领域受重视的素养之一。可以说,算法能力往往决定了一个程序员能够走多远。因此,BAT/FLAG等国内外各大名企非常喜欢在面试环节考核求职者的算法编程,这也成为了无数准程序员们过不去的一道“坎”。如何入门并成为一名出色的算法工程师?但无论半路出家还是科班出身,除学生时代搞算法竞赛的同学外真正用心学习过算法与数据结构太少太少。对于后期想要学习算法与数据结构却不得不面对以下问题:没有自己的知识框架,无法关联知识点,学习效率低有疑问而无人解答,有问题无法理解全靠猜测,一个问题卡好几天市面上资料题解质量参差不齐,正确性未可知Google算法-工程师尹成大哥学习算法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值