pyAudioAnalysis是一个开放的Python库,提供了许多与音频相关的功能,着重于特征提取,分类,分段和可视化问题。
功能
pyAudioAnalysis是一个Python库,涵盖了广泛的音频分析任务。
通过pyAudioAnalysis您可以:提取音频特征和表示形式(例如,mfccs, spectrogram, chromagram)
训练,参数调整和评估音频片段的分类器
分类未知声音
检测音频事件并从长时间录音中排除静音期
执行监督性细分(联合细分-分类)
执行无监督的分段(例如,说话者二值化)并提取音频缩略图
训练和使用音频回归模型(示例应用程序:情感识别)
应用降维以可视化音频数据和内容相似性
实用功能
将Mp3批量转换为Wav
函数使用提供的采样率(第二个参数)和通道数(第三个参数)convertDirMP3ToWav(dirName, Fs, nC, useMp3TagsAsName = False)将文件夹的所有MP3文件转换dirName为WAV文件。如果将最后一个参数(useMp3TagsAsName)设置为True,则输出的WAV文件将通过MP3标签(歌手和歌曲名)命名,否则将使用MP3文件名(当然,扩展名为.wav)
命令行使用示例
python audioAnalysis.py dirMp3toWa