![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音识别
文章平均质量分 91
糊涂小菜鸟
计算机、图像识别、目标检测、语音处理和识别
展开
-
语音信号的特征分析
前言语音信号处理主要包括语音通信(语音编码),语音合成和语音识别等,前提是对语音信号进行分析。只有将语音信号分析表示成其本质特性的参数,才有可能利用这些参数进行高效的语音通信,才可能建立用于语音合成的语音库,才有可能建立用于识别的模板或知识库。根据分析的参数不同,语音信号分析可分为时域、频域倒谱域等方法。贯穿于语音信号分析全过程的是“短时分析技术”,语音是一个非稳定的过程,具有时变特性,但是在一个较短的时间范围内其特性基本保持不变,即相对稳定,可以看成一个准稳定状态,因此一般分析语音都是进行“短时分析”。原创 2021-09-10 17:21:52 · 5112 阅读 · 0 评论 -
Dual-Signal Transformation LSTM Network for Real-Time Noise Suppression(DTLN模型)
前言前面介绍了DNS-challenge 2020的第一名DCCRN模型原创 2021-08-26 11:21:54 · 3007 阅读 · 0 评论 -
Deep Complex Convolution Recurrent Network(DCCRN模型)
Abstract深度学习给语音增强带来很多益处,传统的时频域(TF)方法主要通过朴素卷积神经网络(CNN)或递归神经网络(RNN)预测TF掩码或语音频谱。一些研究将将复值谱图作为训练目标,在实值网络中训练,分别预测幅值和相位分量或实部和虚部。特别是卷积递归网络(CRN)集成了卷积编解码器(CED)结构和长短期记忆(LSTM),已被证明对复杂目标有帮助。为了更好的训练复杂目标,本文提出了Deep Complex Convolution Recurrent Network(DCCRN)模型。该模型在Inter翻译 2021-08-19 15:59:23 · 2752 阅读 · 1 评论 -
语音信号处理二
前言前面学习了傅里叶变换,以及离散傅里叶变换和快速傅里叶变换,可以将一个采集的声波时域图谱变换到频域图谱,从而更好的分析语音的特征、性质,为后续工作做好准备。然后,将声波信号由时域图谱变换到频域图谱,使得信号丢失了时间信息,而对于非平稳信号,时间是一个很重要的特性,为了解决这个问题,可以将一段语音信息进行分帧处理,对每一帧做快速傅里叶变换,这叫做短时傅里叶变换(STFT)。另外,人耳能听到的频率范围是20-20000HZ,但是人耳对HZ单位不是线性敏感,而是对低HZ敏感,对高HZ不敏感,将HZ频率转化为梅原创 2021-08-18 17:38:46 · 962 阅读 · 1 评论 -
声音的特性
前言本文主要介绍声音的一些特性,以及相关的一些理论知识,作为后续学习语音处理的预备知识。本文主要从声音的本质、特性、以及延申的一些相关概念对声音进行简单的介绍。声音是什么物理学:声波, 是由振动物体产生, 并在媒介中传播。声波可以理解为介质偏离平衡态的 小扰动的传播。这个传播过程只是能量的传递过程,而不发生质量的传递。生物学:是指声波作用于听觉器官所引起的一种主观感觉。声音的特性声音物理特性:频率强度声谱(频谱)人耳主观感觉:音调响度音色音调主要又频率决定,原创 2021-08-17 16:05:51 · 2201 阅读 · 0 评论 -
语音信号处理一
语音信号处理前言音频信号傅里叶变换功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入前言准备入门语音处理,记录下自己学习的情况,如有错误之处,欢迎各位大佬指正。音频信号声音是一种机械波,即声波,是一种信号,一般称为音频信号。原原创 2021-08-16 16:50:10 · 539 阅读 · 0 评论