1. 数据集准备和工具安装

最新推荐文章于 2022-11-19 15:11:36 发布

z小白

最新推荐文章于 2022-11-19 15:11:36 发布

阅读量9.9k

点赞数 8

分类专栏：声音识别声音识别教程文章标签：声音识别 sound recognition 环境声数据集 keras librosa

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzc15806/article/details/84972108

版权

数据集和代码均已上传到Github中，欢迎大家下载使用。

Github地址：https://github.com/JasonZhang156/Sound-Recognition-Tutorial

如果这个教程对您有所帮助，请不吝贡献您的小星星Q^Q.

简介

声音识别指的是将声波转化为某种特定描述的一种技术，通常包括语音识别、声纹识别、声音场景识别等。目前的声音识别技术主要是机器学习、深度学习中的一些方法，比如GMM、CNN、RNN等。这个系列的教程主要是带大家了解一下声音识别的整个流程，包括数据分析、特征提取、模型构建、模型训练、模型测试等。

数据集准备

声音识别的各个领域都有很多公开数据集供研究者使用，因为博主本人是做声音场景识别的，所以本次准备的数据集是有关环境声的数据集。在环境声方面，比较常用的几个公共数据集整理如下：

环境声数据集统计
数据集	样本数	类别数	总时长	链接
ESC-10	400	10

最低0.47元/天解锁文章

关注

8
点赞
踩
35

收藏

觉得还不错? 一键收藏
18
评论
1. 数据集准备和工具安装

数据集和代码均已上传到Github中，欢迎大家下载使用。Github地址：https://github.com/JasonZhang156/Sound-Recognition-Tutorial如果这个教程对您有所帮助，请不吝贡献您的小星星Q^Q.简介声音识别指的是将声波转化为某种特定描述的一种技术，通常包括语音识别、声纹识别、声音场景识别等。目前的声音识别技术主要是机器学习、深度...
复制链接

扫一扫

专栏目录

z小白 CSDN认证博客专家 CSDN认证企业博客

码龄8年

79: 原创

3万+: 周排名

169万+: 总排名

169万+: 访问

: 等级

8890: 积分

545: 粉丝

1128: 获赞

339: 评论

4299: 收藏

私信

关注

热门文章

分类专栏

深度学习 24篇
声音识别教程 12篇
Keras 7篇
TensorFlow 5篇
python 22篇
声音识别 13篇
机器学习 3篇
keras 19篇
人工智能 2篇
matlab 4篇
论文导读 2篇
深度学习 25篇
社会百态 1篇
杂七杂八 6篇
Ubuntu 5篇
PyTorch 2篇
数据结构与算法 2篇
爬虫 1篇
Java 1篇
声源定位 1篇

最新评论

1. 数据集准备和工具安装
IT123456ZXM: 博主你好，代码下载之后老报错，waveplot和logamplitude这两个找不到，请问博主能给出对应安装包的版本号吗其他运行成功的可以把自己安装包的版本号发一下吗
1. 数据集准备和工具安装
IT123456ZXM: 博主你好，代码下载之后老报错，waveplot和logamplitude这两个找不到，请问博主能给出对应安装包的版本号吗
Pytorch编译安装warp-CTC
m0_71516629: win10怎么弄啊
音频处理库—librosa的安装与使用
m0_59781092: 你好，我用pip安装librosa的时候报错failed with initial frozen solve. Retrying with flexible solve.该怎么解决呀
Jupyter Notebook 插入图片的几种方法
qq_53681920: 感谢大佬，可以插入了，很方便

最新文章

目录

评论 18

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。