![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
天池学习之路
文章平均质量分 86
_Puppet_
这个作者很懒,什么都没留下…
展开
-
零基础入门语音识别-食物声音识别 Task03『音频数据特征提取』
文章目录音频特征提取MFCC特征提取短时傅里叶分析梅尔频谱和梅尔倒谱梅尔滤波器梅尔倒谱参考资料 音频特征提取 在Task03中,我们将简要介绍以下特征,并详细学习MFCC特征提取知识: 过零率 (Zero Crossing Rate) 频谱质心 (Spectral Centroid) 声谱衰减 (Spectral Roll-off) 梅尔频率倒谱系数 (Mel-frequency cepstral coefficients ,MFCC) 色度频率 (Chroma Frequencies) MFCC特征原创 2021-04-17 23:23:49 · 203 阅读 · 0 评论 -
零基础入门语音识别-食物声音识别 Task02『赛题数据介绍与分析』
目录介绍一、下载数据集二、数据处理与分析1.导入音频处理库2.查看数据基本情况3.查看音频特征参考资料 介绍 本文主要是通过对声音数据介绍与分析。在本次Task02的学习之前,我们先来思考以下问题: 声音是什么呢? 声音的原理是什么? 我们应该如何去分析声音数据? 我的思考: 声音是振动产生的声波,通过介质(气体、固体、液体)传播并能被人或动物听觉器官所感知的波动现象。 声音是一种波动,当演奏乐器、拍打一扇门或者敲击桌面时,声音的振动会引起介质——空气分子有节奏的振动,使周围的空气产生疏密变化,形成原创 2021-04-15 15:43:22 · 277 阅读 · 0 评论 -
零基础入门语音识别-食物声音识别 Task01『Baseline学习』
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录介绍一、下载数据集二、导入数据三、建立模型四、卷积神经网络原理(CNN)卷积——提取特征池化层(下采样)——数据降维,避免过拟合全连接层——输出结果总结 介绍 本篇文章主要是我在阿里云天池学习赛零基础入门语音识别-食物声音识别上的学习笔记。参加天池比赛是快速入门数据科学的一条必经之路,感兴趣的小伙伴也可以一起参加天池比赛噢(虽然我也还是小白,嘻嘻)~ 一、下载数据集 首先通过shell对数据进行下载,也自己可以手动进行下载。 #训原创 2021-04-13 23:52:37 · 642 阅读 · 1 评论