- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 ASR-语音预处理(三):可视化
一.可视化 二.代码: 三.程序输出: 一.可视化 本节主要介绍如何将语音信号可视化,以及读取wav和label文件并保存为字典,列表。 输入:输入的wav文件所对应的数据矩阵wave_data和帧率framerate。 例:[[1507 1374 1218 … -78 -127 -43]] ,16000 输出:可视化图,如波形图,频谱图 ...
2018-09-10 11:03:18 1282
原创 ASR-语音预处理(二):时域转频域
一.时域转频域 二.代码: 三.程序输出: 一.时域转频域 这节主要介绍如何经过傅里叶变换将音频转到频域,以便于后续的特征提取和识别。先后进行加窗、分帧、FFT和取log操作。 输入:音频矩阵wavsignal ,帧率fs 例:[[1507 1374 1218 … -78 -127 -43]],16000 输出:转成频域后的音频矩阵data_i...
2018-09-07 15:38:17 2354
原创 ASR-语音预处理(一):音频读取
一.音频读取 二.代码: 三.程序输出: 一.音频读取 这是语音识别系列的第一篇博文,主要介绍音频如何读取以及如何转成矩阵形式。 输入:wav文件 例:A2_1.wav 输出:输入的wav文件所对应的数据矩阵wave_data和帧率framerate。 例:[[1507 1374 1218 … -78 -127 -43]] ,16000 ...
2018-09-04 11:12:09 4424 6
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人