零基础语音识别入门baseline_task1

最新推荐文章于 2022-03-13 15:04:32 发布

icdatsc

最新推荐文章于 2022-03-13 15:04:32 发布

阅读量296

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_57173763/article/details/115694491

版权

初步了解了baseline，并成功跑通。在这里插入图片描述
然后讲一下我理解的整个baseline的过程
1.首先导入了个音频库，里面是动物吃不同食物的声音。
2.然后是特征提取以及数据集的建立，
这里运用了mfcc的方法，
个人理解，mfcc就是在语音识别领域，将语音物理信息（频谱包络和细节）进行编码运算得到的一组特征向量。
里面的mel滤波器组，将语音变换到mel域，mel域是仿照人耳设计的，
更符合人耳的听觉特性。
3.cnn卷积神经网络
在这里插入图片描述
卷积层，池化层，关键的两个步骤，主要我的理解是将众多特征向量的特征拟合，变成另外一些向量供机器去训练

一个小白的简介，如果有什么错误，欢迎大佬改正。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
零基础语音识别入门baseline_task1

初步了解了baseline，并成功跑通。然后讲一下我理解的整个baseline的过程1.首先导入了个音频库，里面是动物吃不同食物的声音。2.然后是特征提取以及数据集的建立，这里运用了mfcc的方法，个人理解，mfcc就是在语音识别领域，将语音物理信息（频谱包络和细节）进行编码运算得到的一组特征向量。里面的mel滤波器组，将语音变换到mel域，mel域是仿照人耳设计的，更符合人耳的听觉特性。3.cnn卷积神经网络卷积层，池化层，关键的两个步骤，主要我的理解是将众多特征向量的特征拟合，变成另
复制链接

扫一扫

icdatsc CSDN认证博客专家 CSDN认证企业博客

码龄3年

13: 原创

78万+: 周排名

92万+: 总排名

3765: 访问

: 等级

137: 积分

4: 粉丝

4: 获赞

4: 评论

12: 收藏

私信

关注

热门文章

最新评论

本地pycharm跑cnn baseline遇到的一些问题及解决方案datawhale夏令营
CSDN-Ada助手: 恭喜你写出了第13篇博客！标题看起来非常有趣，我很期待阅读你分享的关于本地pycharm跑cnn baseline遇到的问题和解决方案的经验。你对这个话题的深入探讨将会给读者们带来很多帮助。在接下来的创作中，我建议你可以考虑进一步拓展你的博客内容。比如，可以分享一些实际案例或者更深入的技术细节，这样读者们能够更好地理解和应用你的解决方案。同时，也可以考虑加入一些图像或者代码示例，以提升文章的可读性和实用性。继续保持写作的热情和努力吧！我期待着你未来更多的精彩博客！
脑PET图像分析和疾病预测Baseline精读
嘿嘿嘿K金: 博主，这个源代码和数据集吗，怎么获取
动手学数据分析 task_4 数据可视化
大家一起学编程（python）: 看君一篇文，少填10个坑
动手学数据分析 task_4 数据可视化
彼方: 好文，学习了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。