用于深度神经网络的语音信号预处理

最新推荐文章于 2024-04-29 11:36:27 发布

嘹亮的名字

最新推荐文章于 2024-04-29 11:36:27 发布

阅读量2.7k

点赞数 2

分类专栏：语音处理

本文链接：https://blog.csdn.net/sinat_35637310/article/details/82221514

版权

1. 预备知识（基础概念）

详见 https://blog.csdn.net/shanx_s/article/details/52947007

详见 https://blog.csdn.net/Barry_J/article/details/80996564

2. 读取音频文件并进行音频特征提取

2.1 用audioread(”);函数读取电脑中的音频文件，参数是音频文件的路径：

[sampledata,FS] = audioread('F:1.mp3');

2.2 判断音频数据是否是双声道，如果是双声道则保留一个声道的数据，用calsample.m文件的函数完成此功能，程序如下：

function sample = calsample(sampledata,FS)
temp_sample = resample(sampledata,1,FS/22050);
[m,n] = size(temp_sample);
if (n == 2)
    sample = temp_sample(:,1);
else
    sample = temp_sample;
end
end

3. MFCC特征提取（语音识别）

简单可以分为如下：

对音频信号预加重、分帧和加窗

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

嘹亮的名字

关注关注

2
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
用于深度神经网络的语音信号预处理

1. 预备知识（基础概念）详见 https://blog.csdn.net/shanx_s/article/details/52947007 详见 https://blog.csdn.net/Barry_J/article/details/809965642. 读取音频文件并进行音频特征提取 2.1 用audioread(”);函数读取电脑中的音频文件，参数是音...
复制链接

扫一扫