语音特征提取工具——opensmile
2. svn_version.h 是干什么的
- 该文件主要用于说明该程序的版本号。
1. smiletypes.h 是干什么的
- 该头文件主要定义不同os平台间不同编译间的opensmile使用的数据类型。主要用于跨平台编译。
1. opensmile概览
工作后一直浑浑噩噩,深知自己不能再如此沉沦下去;痛定思痛,决定重拾老本行——AI语音,学习语音不得不提高这款开源软件——opensmile,从语音采集到AI语音的整个流程,它均已实现,为了提高自己能力,决定将该款开源软件进行学习。
1.1 opensmile特点
- 支持声音的采集、特征提取、识别等一系列的声音处理方案
- 同时支持在线语音处理与离线处理,在线语音处理时使用增量处理的方式
- 支持开源画图软件 gnuplot
- 支持开源声音录入软件openAudio
- 支持opencv处理视频流
1.2 opensmile 功能一览
1.2.1 数据输入
- PCM (RIFF-WAVE)
- HTK 参数文件
- csv文件(comma separated value)
- WEAK’s ARFF文件(维基百科文件)
- openCV 的视屏流
- openAudio的语音流