一、安装opensmile的python库
1.1 安装
pip install opensmile
1.2 使用
import opensmile
smile = opensmile.Smile(
feature_set=opensmile.FeatureSet.eGeMAPSv02, # egemaps特征集
feature_level=opensmile.FeatureLevel.Functionals # 功能级特征
)
audio_file = " " # 需要处理的语音文件的地址
save_csv = " " # 存储特征的csv的地址
features = smile.process_file(audio_path)
features.to_csv(save_csv)
输出的features为dataframe数据类型 ,每一列是该特征集中的一个特征。输出的特征可以存入csv文件供后续使用
1.3 优劣
优点:安装和使用方便,无需配置复杂的config文件;能够方便地批量处理多条语音数据
缺点:只有部分特征集可以使用,诸如IS09-13就无法通过这种方式提取,具体见opensmile · PyPI
二、安装opensmile软件本体,编写python代码调用命令行实现批量特征提取(以windows11为例)
2.1 安装
从opensmile的githu