openSMILE提取音频特征（用于情感分类）

最新推荐文章于 2023-11-22 10:01:07 发布

wust不吃洋葱

最新推荐文章于 2023-11-22 10:01:07 发布

阅读量1.1k

点赞数 2

文章标签：深度学习语音识别 python

本文链接：https://blog.csdn.net/qq_43882150/article/details/120158424

版权

环境：windows10

pycharm2019.3.3

python37

main.py

import os
import numpy as np
import csv
import sys


def excuteCMD(_pathExcuteFile, _pathConfig, _pathAudio, _pathOutput):
    cmd = _pathExcuteFile + " -C " + _pathConfig + \
        " -I " + _pathAudio + " -O " + _pathOutput + \
        ".txt -csvoutput " + _pathOutput + ".csv "
    print(cmd)
    return cmd
def coverTextToNumpy(nameFront):
    _pathOutput = os.path.join(pathOutputRoot, nameFront + ".txt")
    if(not os.path.exists(_pathOutput)):
        return 
    f = open(_pathOutput, "r")
    text = f.read()
    dataBox = text.split(',')
    dataList = []
    countRow = 0
    for i in range(len(dataBox)):
        #print(dataBox[i])
        if("'" in dataBox[i] ):
            dataList.append([])
        else:
            if("?" not in dataBox[i]):
                #print(len(dataList))
                #print((dataBox[i]))
                if('0.0' in dataBox[i]):
                    continue
                dataList[len(dataList) - 1].append(dataBox[i])
    '''
    for i in range(len(dataList)):
        print(len(dataList[i]),dataList[i][len(dataList[i])-1])
    '''

    npList = np.array(dataList)
    print(npList.shape)
    np.save(os.path.join(pathOutputRoot, nameFront + ".npy"), npList)


def coverCsvToNumpy(nameFront):
    _pathOutput = os.path.join(pathOutputRoot, nameFront + ".csv")
    if(not os.path.exists(_pathOutput)):
        return 
    csvfile = open(_pathOutput,'r')
    reader = [each for each in csv.DictReader(csvfile, delimiter=';')]
    dataList = []
    for row in reader:
        dataList.append([])
        for i in row:
            if(i in 'name' or i in 'frameTime'):
                continue
            dataList[len(dataList) - 1].append(row[i])
    csvfile.close()
    npList = np.array(dataList)
    print(npList.shape)
    np.save(os.path.join(pathOutputRoot, nameFront + ".npy"), npList)

pathExecute = ""
pathModel = sys.argv[1]
pathExcuteFile = pathExecute + "bin\\Win32\\" + "SMILExtract_Release"
pathConfig = pathExecute + "config\\" + pathModel + ".conf"
pathAudioRoot = "audio"
pathOutputRoot = "output"

for i in os.listdir(pathAudioRoot):
    nameBehind = os.path.splitext(i)[1]
    nameFront = os.path.splitext(i)[0]
    if nameBehind == '.wav':
        print(i)
        _pathOutput = os.path.join(pathOutputRoot, pathModel + nameFront)
        _pathAudio = os.path.join(pathAudioRoot, i)
        os.system(excuteCMD(pathExcuteFile, pathConfig, _pathAudio, _pathOutput))
        coverTextToNumpy(pathModel+nameFront)
        coverCsvToNumpy(pathModel + nameFront)

将main.py中的pathModel修改成配置文件的名字，比如"IS09_emotion"

☆将pathModel = sys.argv[1]删除，再把pathModel换成需要使用的配置

运行代码，在output文件中看到输出的特征

这是对名字为one.wav的音频处理的结果。

参考：

GitHub - MichaelPanW/opensmile-python: use opensmile lib to application

wust不吃洋葱

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
openSMILE提取音频特征（用于情感分类）

main.pyimport osimport numpy as npimport csvimport sysdef excuteCMD(_pathExcuteFile, _pathConfig, _pathAudio, _pathOutput): cmd = _pathExcuteFile + " -C " + _pathConfig + \ " -I " + _pathAudio + " -O " + _pathOu...
复制链接

扫一扫