DCASE2020task1a大赛第二名代码复现

最新推荐文章于 2025-05-06 13:55:58 发布

山与山

最新推荐文章于 2025-05-06 13:55:58 发布

阅读量453

点赞数 1

文章标签： python github pycharm

本文链接：https://blog.csdn.net/weixin_44375277/article/details/133123043

版权

项目为：DCASE2020_task1-master，下面是对应的github网址

GitHub - MihawkHu/DCASE2020_task1: Code for DCASE 2020 task 1a and task 1b.

1、配置环境

首先根据配置文件environment.yml配置相应的运行环境

有一篇经验贴可以参考

如何运行别人的源码（配置environment.ylm并为pycharm配置虚拟环境以及一些错误处理）_用pycharm如何使用environment.yaml安装环境_努力敲代码的小方的博客-CSDN博客

环境配置成功！！！！

2、生成特征文件

环境配置完成后，会发现该项目缺少部分内容，主要是该项目只有训练路径文件fold1_train.csv（训练集路径文件）/fold1_evaluate.csv（测试集路径文件）/fold1_train_all.csv（所有训练集路径文件，包含相对应的数据增强后的文件）

只有路径文件，但是没有特征文件，所以这里我们需要实现特征文件的创建，首先需要下载相对应的数据集，可以去官网下载，也可以使用这个链接TAU Urban Acoustic Scenes 2020 Mobile, Development dataset | Zenodo，可能需要搭梯子。

下载好之后根据把所有的音频保存到一个文件里可以根据你的地址自行安排，例如我的是/home/ljp/桌面/dataset/audio，然后执行extr_feat_2020_nodelta_scaled.py方法，修改一下csv_file文件，改为以下两个文件，最后会根据'evaluation_setup/fold1_train.csv'/evaluation_setup/fold1_evaluate.csv'执行两次，根据各自的路径和标签生成两次特征文件，保存到output_path = 'features/logmel128_scaled'文件中，可能会出现音频文件无法查询到的报错，例如某某音频找不到，可能是因为你的数据集是最新下载的，有部分老的音频已经被删除，只需要在'evaluation_setup/fold1_train.csv'/evaluation_setup/fold1_evaluate.csv'中找出名字的路径，删掉即可，大概有四五个的样子。

这样就已经构建好了特征文件！！

有个文件夹是做数据增强的，和这个差不多，自行研究！