有关opensmile的特征描述

一、6225个特征

        图1所示内容为部分提取特征的属性值。

图1-1  txt文件部分截图

二、相关特征说明

表1-1 16个低级描述符(LLDs)的名称

序号

名称

描述

1

pcm_RMSenergy

信号帧均方根能量

2

mfcc

梅尔频率倒谱系数1-12

3

Pcm_zcr

时间信号的过零率(基于帧)

4

voiceProb

从ACF计算的发声概率

5

F0

从倒谱计算的基频

        附加到低级描述符名称的后缀_sma表示它们是通过窗口长度为3的移动平均滤波器进行平滑。附加到sma的后缀_de表示当前特征是低级描述符平滑后的一阶delta系数(微分)。

表1-2

序号

名称

描述

1

max

轮廓的最大值

2

min

轮廓的最小值

3

range

max- min

4

maxPos

最大值的绝对位置(以帧为单位)

5

minPos

最小值的绝对位置(以帧为单位)

6

amean

轮廓的算术平均值

7

linregc1

轮廓线性逼近的斜率(m)

8

linregc2

轮廓线性逼近的偏移量(t)

9

linregerrQ

计算的二次误差作为线性近似值和实际轮廓的差值

10

stddev

轮廓上的值的标准偏差

11

skewness

偏度(3阶矩)

12

kurtosis

峰度(4阶矩)

13

percentile1.0

轮廓的离群值鲁棒最小值,按1%百分位数表示

14

percentile99.0

轮廓的离群值鲁棒最大值,按99%百分位数表示

15

pctlrange0-1

由1%和99%的百分点的范围表示的离群值鲁棒信号范围“max-min”

16

upleveltime75

信号超过(75%*范围+min)的时间百分比

17

upleveltime90

信号超过(90%*范围+min)的时间百分比

注:举例说明特征如何组成?

        例1:该集包含的1582个特征是由34个低级描述符(LLDs)和34个相应的delta作为68个LLDs轮廓值,在此基础上应用21个函数得到1428个特征,另外,对4个基于音高的LLD及其4个delta系数应用了19个函数得到152个特征,最后附加音高(伪音节)的数量和总数输入的持续时间(2个特征)。

        例2:该集包含的4368个特征是由4个能量相关+50个频谱相关的低级描述符(LLDs)和54个相应的delta作为108个LLDs,在此基础上应用33个基本函数+平均值、最小值、最大值、标准差得到3996个特征;5个声音相关和5个对应的delta作为10个LLDs,在此基础上应用33个基本函数+二次平均、上升时长、下降时长得到360个特征;6个F0基本函数和对应的delta,12个特征。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
### 回答1: 以下是一个利用opensmile进行语音识别和分析的例子,使用Python实现的代码: ```python import opensmile import pandas as pd # 初始化opensmile smile = opensmile.Smile( feature_set=opensmile.FeatureSet.GeMAPSv01b, feature_level=opensmile.FeatureLevel.Functionals, ) # 读取音频文件 audio_file = "example.wav" # 提取特征 features = smile.process_file(audio_file) # 将特征转换为DataFrame df = pd.DataFrame(features, index=[]) # 打印DataFrame print(df) ``` 这个例子使用opensmile提取了一个音频文件的语音特征,并将其转换为DataFrame格式。这些特征可以用于语音识别和情感分析等任务。 ### 回答2: 利用opensmile进行语音识别和分析的一个例子是情感分析。情感分析是指对语音中的情感进行识别和分类的任务。下面是一个用Python实现的代码示例: ```python import os from opensmile import pyOpenSMILE # 设置opensmile的路径 opensmile_path = "/path/to/opensmile/opensmile-3.0/bin/linux_x64_standalone_static/SMILExtract" # 设置配置文件路径 config_file_path = "/path/to/opensmile/opensmile-3.0/config/IS13_ComParE.conf" # 设置输入音频文件路径 input_audio_path = "/path/to/input/audio.wav" # 设置输出特征文件路径 output_feature_path = "/path/to/output/features.csv" # 创建OpenSMILE对象 smile = pyOpenSMILE.OpenSMILE(opensmile_path, config_file_path) # 提取音频特征 smile.extract_feature(input_audio_path, output_feature_path) # 检查特征文件是否生成 if os.path.exists(output_feature_path): print("音频特征提取成功!") else: print("音频特征提取失败!") ``` 在上述代码中,我们首先导入opensmile库,并设置opensmile的可执行文件路径和配置文件路径。然后,我们设置输入音频文件路径和将要保存特征的输出文件路径。接下来,我们创建一个OpenSMILE对象。通过调用`extract_feature`方法,我们将输入音频文件提供给OpenSMILE,它将根据指定的配置文件提取音频中的情感特征,并将特征保存在指定的输出文件中。最后,我们检查特征文件是否生成,以确认特征提取是否成功。 请注意,以上代码仅为示例,需要根据个人需求和opensmile库的安装路径进行相应的修改。此外,opensmile库还提供其他功能,如音频预处理、支持不同配置文件、实时特征提取等。您可以根据需要进一步探索opensmile库的功能和使用方法。 ### 回答3: 一个利用opensmile进行语音识别和分析的例子是基于音频数据进行情绪识别。以下是一个使用python实现的简单代码示例: 首先,需要安装opensmile和pandas库,可以通过以下命令进行安装: ``` pip install opensmile pandas ``` 接下来,导入所需的库: ```python import librosa import pandas as pd import subprocess import os ``` 定义一个函数来提取音频数据的特征: ```python def extract_features(audio_file): subprocess.call(['SMILExtract', '-C', 'opensmile/config/IS13_ComParE.conf', '-I', audio_file, '-O', 'output.csv']) features = pd.read_csv('output.csv', delimiter=',').iloc[:, 1:] os.remove('output.csv') return features ``` 然后,定义一个函数来识别情绪: ```python def recognize_emotion(audio_file): features = extract_features(audio_file) # 在这里根据提取的特征进行情绪识别的处理 # 返回情绪标签结果 return emotion_label ``` 最后,可以调用`recognize_emotion`函数并传入音频文件路径来进行情绪识别: ```python audio_file = 'path_to_audio.wav' emotion_label = recognize_emotion(audio_file) print('识别结果:', emotion_label) ``` 以上代码仅提供了一个基本的示例。实际上,根据应用的需求,还需要对提取的特征进行进一步处理和模型训练,以获得更准确的情绪识别结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我不是哆啦A梦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值