零基础入门语音识别-食物声音识别Task1

最新推荐文章于 2022-03-03 23:15:01 发布

miskirito

最新推荐文章于 2022-03-03 23:15:01 发布

阅读量387

点赞数 2

分类专栏：自主学习 Datawhale组队学习笔记文章标签：语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_57171836/article/details/115683844

版权

自主学习同时被 2 个专栏收录

29 篇文章 2 订阅

订阅专栏

Datawhale组队学习笔记

27 篇文章 0 订阅

订阅专栏

零基础入门语音识别-食物声音识别

本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第八场 —— 零零基础入门语音识别-食物声音识别挑战赛。
baseline由开源学习组织Datawhale提供
https://github.com/datawhalechina/team-learning

Task1 食物声音识别-Baseline-CNN

环境要求
TensorFlow的版本：2.0 +
keras
sklearn
librosa

对CNN提取音频特征的理解.

对CNN提取音频特征的理解

作为第一次参赛的新人，在 Task1中对CNN（卷织神经网络）用来做声音有了新的了解。首次打卡就来说说我对使用CNN提取音频特征的理解。
CNN在图像特征处理的方式有着其独特的优势，而CNN在处理图像上的优秀能力也同样可以运用到语音识别中，在一段音频里，我们首先用Python的音频处理库Librosa提取声音信号的梅尔顿谱特征。然后将提取后的音频当作图谱进行处理从而达到识别语音的目的。

在来根据上图谈谈对池化层的个人理解，池化层将前面卷积层所提取到的特征值进一步细化压缩，突出我们所想要的目标特征，提高识别准确性。
在这里插入图片描述

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
零基础入门语音识别-食物声音识别Task1

零基础入门语音识别-食物声音识别本次新人赛是Datawhale与天池联合发起的零基础入门系列赛事第八场 —— 零零基础入门语音识别-食物声音识别挑战赛。baseline由开源学习组织Datawhale提供https://github.com/datawhalechina/team-learningTask1 食物声音识别-Baseline-CNN环境要求TensorFlow的版本：2.0 +kerassklearnlibrosa对CNN提取音频特征的理解.对CNN提取音频特征的
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。