语音识别
文章平均质量分 51
yxma
这个作者很懒,什么都没留下…
展开
-
语音信号特征提取<二>时域特征(待续)
语音信号特征提取<二>时域特征(待续)事实上,因为语音信号的大多数处理都是在组帧之后进行的。组帧之后,帧序号就代表了时间先后。所以没有多少特征可以在时间域进行提取。常见的几个时域特征分别是:幅值、过零率以及直流偏置、能量以及线性预测编码系数。幅值(Amplitude)过零率(ZCR)&过均值率率(MCR)能量(Energy)线性预测编码系数(LPCC) 具体计算方法如下:幅值(Amplitu原创 2017-04-13 21:24:25 · 9621 阅读 · 0 评论 -
语音信号特征提取<一>预处理
语音信号是一种常见的时间序列,它以离散信号的形式被编码,然后使用一定的文件格式来存储,例如”.wav”。在当前与语音有关的应用中,出了单纯的录制、不做任何处理之后播放之外,几乎所有的应用都要涉及到语音特征的提取,例如语音文本转换、说话人识别、语音情感识别等等。此外,在进行音乐信息检索(MIR)的时候,也需要类似的处理。 语音特征提取就是从数字信号中提取出与我们所要得到的主要信息相关的内容,一般会从原创 2017-03-29 20:24:30 · 19479 阅读 · 6 评论 -
语音识别:理论与实践
学习中……原创 2017-07-14 20:24:06 · 6390 阅读 · 5 评论 -
Ubuntu 16.04安装Kaldi详解
Ubuntu 16.04安装Kaldi详解感谢[luhuang的博客](https://huanglu.me/2017/01/01/ubuntu-install-kaldi-with-network/%20%E2%80%9Cluhuang%E7%9A%84%E5%8D%9A%E5%AE%A2%E2%80%9D)。不同的人在实际安装的过程中会遇到各种各样的问题,我也不例外。遇到了LuHuang的原创 2017-06-21 22:03:43 · 2821 阅读 · 5 评论 -
基于TensorFlow的音频分析
基于TensorFlow的音频分析本文主要梳理一下使用机器学习的方法进行音频分析的基本操作,并且仅用TensorFlow 实现从特征提取到模型训练的整个过程。预计三月份之前完成。...原创 2019-02-25 16:08:21 · 1100 阅读 · 2 评论