Python音频数据预处理-使用pydub模块提取wav音频数据(固定采样点)并存储到csv文件
任务描述将10s、44.1kHZ的wav音频文件处理成5个2s、8000Hz的音频片段,其中每个2s的音频片段都包含8*2(s)*2(channel),000个采样点,即32,000个采样点,前16,000个为左声道采样点,后16,000个为右声道采样点(对于单通道数据,直接复制16,000个采样点追加在后面),再存储到csv文件中。即将10s、44.1kHZ的wav音频文件输出为(5,8000)的特征向量。涉及模块os、shutil、random、numpy、pydub、pandas具体实现.
原创
2021-07-08 13:05:35 ·
2423 阅读 ·
1 评论