零基础入门语音识别-食物声音识别Task2

最新推荐文章于 2024-04-25 20:55:27 发布

miskirito

最新推荐文章于 2024-04-25 20:55:27 发布

阅读量218

点赞数 1

分类专栏：自主学习 Datawhale组队学习笔记文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_57171836/article/details/115740819

版权

自主学习同时被 2 个专栏收录

29 篇文章 2 订阅

订阅专栏

Datawhale组队学习笔记

27 篇文章 0 订阅

订阅专栏

零基础入门语音识别-食物声音识别

对声音识别数据的理解

Task2 食物声音识别-赛题数据介绍分析打卡

本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第八场 —— 零零基础入门语音识别-食物声音识别挑战赛。
baseline由开源学习组织Datawhale提供
https://github.com/datawhalechina/team-learning

在Task2的学习里，我试着理解加载音频库与处理音频数据的基本代码。
实现音频信息的有效识别我觉得离不开对傅里叶变换的理解
在这里插入图片描述

傅里叶变换可以化复杂的卷积运算为简单的乘积运算，从而提供了计算卷积的一种简单手段
在导入来自Kaggle的“Eating Sound Collection”包括20种不同食物的咀嚼声音的数据集后，导入进python的音频处理库Librosa¹提取音频的mfcc特征，查看对应音频的波形幅度包络图及声谱图。
在这里插入图片描述

此外我们可以使用IPython.display.Audio模块播放音频查看音频的数据。
Task2中，我学习最大的收获就是Librosa对音频特征的提取功能，在任务外我也去学习相关的处理原理。
还有还有，我的西瓜书和南瓜书也成功到了手上，看见南瓜书封面右上角的Datawhale小图标对Datawhale的小伙伴超级膜拜有木有！！！作为小白的我很高兴可以在里面学习，明天继续坚持！
1块学习，1块分享，1块成长。

Librosa：它通常用于分析音频信号，但更倾向于音乐，它包括用于构建MIR（音乐信息检索）系统的nuts 和 bolts。 ↩︎

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
零基础入门语音识别-食物声音识别Task2

零基础入门语音识别-食物声音识别对声音识别数据的理解Task2 食物声音识别-赛题数据介绍分析打卡本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第八场 —— 零零基础入门语音识别-食物声音识别挑战赛。baseline由开源学习组织Datawhale提供https://github.com/datawhalechina/team-learning在Task2的学习里，我试着理解加载音频库与处理音频数据的基本代码。实现音频信息的有效识别我觉得离不开对傅里叶变换的理解在
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。