调用OPENSMILE来提取语音特征文件(Python)

简介:

opensmile工具是比较简单的提取语音特征文件的方法之一,一般用来对语音文件(*wav)来提取特征用来训练模型,那么opensmile如何调用,具体代码内容的理解以及结果示意

代码:

#包的引入 这些包python自带
import  os
from subprocess import call
#路径设置
#SMILExtract_Debug.exe所在的文件路径
pathExcuteFile = r'D:\....\.....\.....\SMILExtract_Debug.exe'#不是要求路径具体大小 省略号就是简单省略
#opensmile配置文件所在的路径  一般根据要求会选择不同的配置文件
pathConfig = r'/.../..../.../...*conf'
pathAudio = r'path' #该目录下是各个类别文件夹,类别文件夹下才是wav语音文件,比如说,我把wav文件放在了voice的文件夹里,但是voice在new文件夹里  所以应该具体到new文件夹即可,因为下面的代码是对整个文件夹里的所有文件目录里的文件进行操作,具体适用于多种不同类型的语音来进行提取特征
pathOutput = r'输出目录'#这里的路径可以自行设置比如"...\\...\\"python要加一个\转义字符
#利用cmd调用exe文件
def excuteCMD(_pathExcuteFile,_pathConfig,_pathAudio,_pathOutput):
    cmd = _pathExcuteFile + " -C "+ _pathConfig +" -I "+ _pathAudio + " -O " + _pathOutput
    call(cmd, shell=True)

def loopExcute(pathwav,patharff):         # 子目录,对目录里所有wav目标文件进行处理
    for category in os.listdir(pathwav):
        category_path = os.path.join(pathwav,category)
        for file in os.listdir(category_path):
            if os.path.splitext(file)[1] == '.wav':
                file_path = os.path.join(category_path,file)
                name = os.path.splitext(file)[0]
                outputname = 'all_test.arff'#这里是将所有的特征文件写道一个arff文件里,也可以用一个一直在变的名称来实现一个语音对应一个特征文件
                output_path = os.path.join(patharff,outputname)
                excuteCMD(pathExcuteFile, pathConfig, file_path, output_path)

if __name__ == '__main__':
    #excuteCMD(pathExcuteFile, pathConfig, pathAudio, pathOutput)
    loopExcute(pathAudio, pathOutput)

#提取特征比较长,要耐心等待

文件展示

arff:在这里插入图片描述不同配置文件的呈现形式一般不一样
csv:
在这里插入图片描述

后续更新:

特征文件具体用来作为训练模型的输入数据,那么对于分类最简单的训练工具便是libsvm,那么怎么将生成的arff特征文件(特征文件还可以是csv或者txt等类型文件)变成符合libsvm文件输入的特征文件格式?

评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值