get mfcc with java_如何提取mfcc音频特征并将其传递给cnn来训练模型?

如何使用MFCC算法提取音频特征并与卷积神经网络一起训练模型?在

我用MFCC提取了音频的特征,文件包含浮点列,但我无法区分这些列?在for filename in os.listdir(directoryName):

if filename.endswith('.wav'): # only get MFCCs from .wavs

(rate,sig) = wav.read(directoryName + "/" +filename)

mfcc_feat = mfcc(sig,rate)

fbank_feat = logfbank(sig,rate)

outputFile = resultsDirectory + "/" + os.path.splitext(filename)[0] + ".csv"

file = open(outputFile, 'w+')

numpy.savetxt(file, fbank_feat, delimiter=",")

file.close() # close file

The values contained in the csv file like this.

7.01E+00 5.94E+00 5.28E+00 5.25E+00 5.24E+00

5.87E+00 3.53E+00 3.61E+00 2.32E+00 2.13E+00

5.68E+00 8.36E-01 1.75E-01 -8.48E-01 1.77E+00

7.96E+00 6.12E+

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MFCC(Mel频率倒谱系数)是一种常用的音频特征,可以用于语音识别、说话人识别等任务。下面是提取整个音频文件夹的MFCC特征并将其保存为npy数组的详细步骤及Python代码: 1. 安装必要的Python库,包括 librosa 和 numpy: ``` pip install librosa pip install numpy ``` 2. 导入库: ```python import librosa import numpy as np import os ``` 3. 设置参数: ```python # 设置参数 FRAME_SIZE = 0.025 # 帧长(秒) FRAME_STRIDE = 0.01 # 帧移(秒) N_MFCC = 13 # MFCC数量 ``` 4. 定义函数,用于提取MFCC特征: ```python def extract_mfcc(file_path, frame_size=FRAME_SIZE, frame_stride=FRAME_STRIDE, n_mfcc=N_MFCC): """ 提取音频文件的MFCC特征 :param file_path: 音频文件路径 :param frame_size: 帧长(秒) :param frame_stride: 帧移(秒) :param n_mfcc: MFCC数量 :return: MFCC特征 """ # 加载音频文件 y, sr = librosa.load(file_path, sr=None) # 提取MFCC特征 mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=n_mfcc, n_fft=int(sr * frame_size), hop_length=int(sr * frame_stride)) return mfccs ``` 5. 定义函数,用于提取整个音频文件夹的MFCC特征并将其保存为npy数组: ```python def extract_mfccs_from_folder(folder_path, frame_size=FRAME_SIZE, frame_stride=FRAME_STRIDE, n_mfcc=N_MFCC): """ 提取整个音频文件夹的MFCC特征并将其保存为npy数组 :param folder_path: 音频文件夹路径 :param frame_size: 帧长(秒) :param frame_stride: 帧移(秒) :param n_mfcc: MFCC数量 """ # 获取所有音频文件的路径 file_paths = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.wav')] # 遍历所有音频文件,提取MFCC特征 mfccs_list = [] for file_path in file_paths: mfccs = extract_mfcc(file_path, frame_size, frame_stride, n_mfcc) mfccs_list.append(mfccs) # 将MFCC特征保存为npy数组 np.save('mfccs.npy', mfccs_list) ``` 6. 调用函数,提取整个音频文件夹的MFCC特征并将其保存为npy数组: ```python # 提取整个音频文件夹的MFCC特征并将其保存为npy数组 extract_mfccs_from_folder('audio_folder') ``` 其中,`audio_folder` 是音频文件夹的路径。执行上述代码后,将生成 `mfccs.npy` 文件,其中包含所有音频文件的MFCC特征。每个音频文件的MFCC特征是一个二维数组,其中行数为MFCC数量,列数为帧数。可以使用以下代码加载 `mfccs.npy` 文件: ```python mfccs = np.load('mfccs.npy', allow_pickle=True) ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值