主要技术:Mfcc+GMM
达到目的 : 识别音频中说话人的性别是男还是女的效果
项目的来源:国外(数据集是谷歌的,讲解资料来源于印度的两个哥们)
不足:识别率不高;男性大概是82%左右,女性是90%
数据集下载的地址://download.csdn.net/download/tian_jiangnan/12251687
代码讲解
第一部分、先后训练男、女模型
以下代码运行两次,第一次是source="D:\\pygender\\train\\male" 第二次是source="D:\\pygender\\train\\womale"
这个代码就是提取某类性别的音频的mfcc特征,然后注入GMM中生成模型就可以了;代码重点在于提取mfcc特征
import os
import pickle
import numpy as np
from scipy.io.wavfile import read
from sklearn.mixture import GaussianMixture
import python_speech_features as mfcc
from sklearn import preprocessing
import warnings
warnings.filterwarnings("ignore")
def get_Mfcc(sr,audio):
features=mfcc.mfcc(audio,sr,0.025,0