零基础入门语音识别task_2赛题数据集的学习

最新推荐文章于 2021-04-16 00:43:02 发布

icdatsc

最新推荐文章于 2021-04-16 00:43:02 发布

阅读量120

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_57173763/article/details/115733466

版权

task2学习了赛题数据集，本比赛的背景是食物的声音的分类，是一个充满趣味性的任务，本次比赛的数据集来自Kaggle的“Eating Sound Collection”（可商用），数据集中包含20种不同食物的咀嚼声音，赛题任务是给这些声音数据建模，准确分类。在这里插入图片描述

然后是音频处理库的学习，python有很多厉害的库，这次用到的是Librosa，它通常用于分析音频信号，但更倾向于音乐，它包括用于构建MIR（音乐信息检索）系统的nuts 和 bolts，它的功能：
加载展示一个声音文件的特性
声谱表示
特征提取和操作
时间——频率转换
语音切割
序列模型…等
这里还拓展了另外一个库，PyAudio，用来播放音频,用实例展示

在这里插入图片描述
还有查看波形幅度包络图，这里还用了matplotlib这个库，用来画图

还有声谱图

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

icdatsc CSDN认证博客专家 CSDN认证企业博客

码龄4年

13: 原创

78万+: 周排名

215万+: 总排名

4244: 访问

: 等级

137: 积分

4: 粉丝

4: 获赞

4: 评论

13: 收藏

私信

关注

热门文章

最新评论

本地pycharm跑cnn baseline遇到的一些问题及解决方案datawhale夏令营
CSDN-Ada助手: 恭喜你写出了第13篇博客！标题看起来非常有趣，我很期待阅读你分享的关于本地pycharm跑cnn baseline遇到的问题和解决方案的经验。你对这个话题的深入探讨将会给读者们带来很多帮助。在接下来的创作中，我建议你可以考虑进一步拓展你的博客内容。比如，可以分享一些实际案例或者更深入的技术细节，这样读者们能够更好地理解和应用你的解决方案。同时，也可以考虑加入一些图像或者代码示例，以提升文章的可读性和实用性。继续保持写作的热情和努力吧！我期待着你未来更多的精彩博客！
脑PET图像分析和疾病预测Baseline精读
嘿嘿嘿K金: 博主，这个源代码和数据集吗，怎么获取
动手学数据分析 task_4 数据可视化
大家一起学编程（python）: 看君一篇文，少填10个坑
动手学数据分析 task_4 数据可视化
彼方: 好文，学习了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。