Mfcc+GMM训练性别检测器模型，达到识别音频性别的效果

最新推荐文章于 2023-12-18 11:03:13 发布

tian_jiangnan

最新推荐文章于 2023-12-18 11:03:13 发布

阅读量2.2k

点赞数 3

分类专栏：人工智能专栏

本文链接：https://blog.csdn.net/tian_jiangnan/article/details/104047901

版权

主要技术：Mfcc+GMM

达到目的 : 识别音频中说话人的性别是男还是女的效果

项目的来源：国外（数据集是谷歌的，讲解资料来源于印度的两个哥们）

不足：识别率不高；男性大概是82%左右，女性是90%

数据集下载的地址：//download.csdn.net/download/tian_jiangnan/12251687

代码讲解

第一部分、先后训练男、女模型

以下代码运行两次，第一次是source="D:\\pygender\\train\\male" 第二次是source="D:\\pygender\\train\\womale"

这个代码就是提取某类性别的音频的mfcc特征，然后注入GMM中生成模型就可以了；代码重点在于提取mfcc特征

import os
import pickle
import numpy as np
from scipy.io.wavfile import read
from sklearn.mixture import GaussianMixture
import python_speech_features as mfcc
from sklearn import  preprocessing
import warnings
warnings.filterwarnings("ignore")
def get_Mfcc(sr,audio):
    features=mfcc.mfcc(audio,sr,0.025,0

最低0.47元/天解锁文章

tian_jiangnan

关注

3
点赞
踩
17

收藏

觉得还不错? 一键收藏
2
评论
Mfcc+GMM训练性别检测器模型，达到识别音频性别的效果

首先我们要知道什么是mfcc特征？mfcc实际上就是获取音频的包络，包络是每个人声音的身份证，说白点，每个人的声道形状不一样，但是一个人的声道形状是固定的，这个就是身份证，发出来的声音自然有辨识度。所以我们要提取mfcc特征。怎么提取mfcc？预处理、分帧、加窗、快速傅里叶变换、逆傅里叶变换等第一步、读取音频文件a是.wav音频文件的路径fs是音频的采样率，采样率是每秒音频...
复制链接

扫一扫