人工智能之语音识别技术（四）

最新推荐文章于 2022-12-08 08:30:20 发布

智享AI

最新推荐文章于 2022-12-08 08:30:20 发布

阅读量3.3k

点赞数

分类专栏：语音识别文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guangzhanblog/article/details/109290581

版权

语音识别专栏收录该内容

4 篇文章 6 订阅

订阅专栏

1. 语音信号基础

1.1 语音信号处理的目的

语音信号处理是一门新兴的边缘科学，它是语音学与数字信号处理两个学科相结合的产物。它和认知科学、心理学、语音学、计算机科学、模式识别和人工智能等学科有着紧密的联系。
语音信号处理的目的是要得到某些语音特征参数以便高效地传输或存储；或者是通过某种处理运算以达到某种用途的要求，例如人工合成语音、辨识出讲话者、识别出讲话的内容等

1.2 语音信号处理的基本内容**

语音信号的产生
语音的感知
语音信号处理发展史

2 语音信号的产生

2.1 语音信号产生的过程

语言是人与人之间交流最方便的一种方式，而语音是语言的物质外壳，即语言的外部形式，它是最直接地记录人的思维活动的符合体系。人体中产生声音的结构叫做喉，喉腔中的肌肉上面覆盖着粘膜，这些粘膜组成了声带。

2.2 语音信号的研究分支

从语音传递过程来研究语音的三个分支：

发音语音学（articulatory phonetics）：它从生理角度研究语音，是最早发展起来的语音学。
声学语音学（acoustic phonestic）：它从声学角度研究语音的物理性质，同时考察语音物理性质和发音器官之间的关系，从20世纪40年代开始发展。
听觉语音学和心理语言学（auditory phonestic and psycholingustics）：因为语言传递的起点和终点都在大脑，因此，它以大脑作为研究对象，是比较新的学科。

3 语音的感知

3.1 人耳听声的工作原理

从声音的传播过程我们可以知道，语音的听觉感知是一个服装的人脑-心理过程。科学研究表明，人可以感受到听觉界限范围在20Hz_{20kHz，而强度范围是0}130dB声压级，声音强度太高，感到难以忍受，强度太低则感到寂静无声。

4 语音信号处理发展史

4.1 现代语音信号处理的起源

现代语音信号处理的研究可以追溯到1876年贝尔发明的电话，贝尔首先使用声电、电声转换技术实现了远距离的语音通话。
Homer Dudley等人在1939年提出并成功研制了第一个声码器，从而奠定了语音生成模型的基础。亥姆霍兹在19世纪60年代利用声学方法对元音和歌唱进行研究，从而奠定了语音的声学基础。
语谱图作为语音声学的专用仪器也在20世纪40年代问世，它可以把语音的时变频谱用语图表示，以此可以得到“可见语言”，这些发明在语音信号处理领域就有划时代的意义。

4.2 语音信号处理的分类

语音信号处理可以分为时域、频域和倒频域等方法。
时域分析具有小运算量、物理意义明确且简单的特点。
语音中最重要的感知特性反应在功率谱中，目前对于语音信号的分析都是围绕频域进行的。

4.3 语音信号处理的方法

语音信号处理基本方法分为两种：数字信号处理和模拟信号处理。而目前对语音信号的处理均采用数字处理，这是因为数字信号处理具有很多优点。其表现为：
1. 语音信号具有离散的性质，语音可以看成是许多音素的组合，这就特别适合于数字处理；
2. 数字信号处理具有高可靠性，廉价和快速的优点，容易完成实时处理任务；
3. 数字信号适于在强干扰信道中传输，也易于加密传输。

4.4 语音信号数字处理系统结构

我们在进行语音信号处理时，首先需要进行语音信号的采集，然后才进行语音信号处理。

于加密传输。

语音信号数字处理系统结构

我们在进行语音信号处理时，首先需要进行语音信号的采集，然后才进行语音信号处理。

在这里插入图片描述

关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。