项目为:DCASE2020_task1-master,下面是对应的github网址
GitHub - MihawkHu/DCASE2020_task1: Code for DCASE 2020 task 1a and task 1b.
1、配置环境
首先根据配置文件environment.yml配置相应的运行环境
有一篇经验贴可以参考
环境配置成功!!!!
2、生成特征文件
环境配置完成后,会发现该项目缺少部分内容,主要是该项目只有训练路径文件fold1_train.csv(训练集路径文件)/fold1_evaluate.csv(测试集路径文件)/fold1_train_all.csv(所有训练集路径文件,包含相对应的数据增强后的文件)
只有路径文件,但是没有特征文件,所以这里我们需要实现特征文件的创建,首先需要下载相对应的数据集,可以去官网下载,也可以使用这个链接TAU Urban Acoustic Scenes 2020 Mobile, Development dataset | Zenodo,可能需要搭梯子。
下载好之后根据把所有的音频保存到一个文件里可以根据你的地址自行安排,例如我的是/home/ljp/桌面/dataset/audio,然后执行extr_feat_2020_nodelta_scaled.py方法,修改一下csv_file文件,改为以下两个文件,最后会根据'evaluation_setup/fold1_train.csv'/evaluation_setup/fold1_evaluate.csv'执行两次,根据各自的路径和标签生成两次特征文件,保存到output_path = 'features/logmel128_scaled'文件中,可能会出现音频文件无法查询到的报错,例如某某音频找不到,可能是因为你的数据集是最新下载的,有部分老的音频已经被删除,只需要在'evaluation_setup/fold1_train.csv'/evaluation_setup/fold1_evaluate.csv'中找出名字的路径,删掉即可,大概有四五个的样子。
这样就已经构建好了特征文件!!
有个文件夹是做数据增强的,和这个差不多,自行研究!
3、其他小问题
在进行代码执行的时候,以train_fsfcnn.py
为例,会出现utils.py和funcs.py文件没有import成功,可以把这两个文件直接复制一份,一起放到文件里,这样就可以了