语音特征提取工具——opensmile

opensmile是一款强大的语音处理开源软件,提供声音采集、特征提取、识别等功能,支持在线与离线处理,包括数据输入、信号处理、数据处理、低维语音和视频特征等。它还支持gnuplot和openAudio等工具,能处理多种数据格式,并具备多种信号处理和特征提取算法,如MFCC、LPC等。此外,opensmile还包括基于Fuzzy Logic和LSTM的语音激活检测以及分类器功能。
摘要由CSDN通过智能技术生成


2. svn_version.h 是干什么的

  • 该文件主要用于说明该程序的版本号。

1. smiletypes.h 是干什么的

  • 该头文件主要定义不同os平台间不同编译间的opensmile使用的数据类型。主要用于跨平台编译。

1. opensmile概览

工作后一直浑浑噩噩,深知自己不能再如此沉沦下去;痛定思痛,决定重拾老本行——AI语音,学习语音不得不提高这款开源软件——opensmile,从语音采集到AI语音的整个流程,它均已实现,为了提高自己能力,决定将该款开源软件进行学习。

1.1 opensmile特点

  • 支持声音的采集、特征提取、识别等一系列的声音处理方案
  • 同时支持在线语音处理与离线处理,在线语音处理时使用增量处理的方式
  • 支持开源画图软件 gnuplot
  • 支持开源声音录入软件openAudio
  • 支持opencv处理视频流

1.2 opensmile 功能一览

1.2.1 数据输入

  • PCM (RIFF-WAVE)
  • HTK 参数文件
  • csv文件(comma separated value)
  • WEAK’s ARFF文件(维基百科文件)
  • openCV 的视屏流
  • openAudio的语音流
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值