本期给大家介绍的是128基于深度学习的根据音频识别乐器,效果图如下:
代码下载和视频演示地址:
128基于深度学习的根据音频识别乐器_哔哩哔哩_bilibili
代码整体是非常简便的,主要是data数据集文件夹和3个py文件。
运行01.py能将音频数据保存在txt格式的文本里面,并划分训练集和验证集。
运行02train.py会txt文本里面的音频数据进行读取并训练模型,训练好的模型也保存在logs文件夹下。
训练完成后还会生成评价指标图,f1-score,精确率和召回率。
运行03pyqt.py可以选择自己感兴趣的音频进行识别,通过调用上一步训练好的模型识别音频是哪种乐器发出来的。
注:
下载本代码环境自行安装
安装python和pytorch即可运行,
安装环境可参考博客: