频域增强（Frequency Domain Enhancements） or/and 时域增强（Time Domain Enhancements）

最新推荐文章于 2024-03-27 17:44:23 发布

码匀

最新推荐文章于 2024-03-27 17:44:23 发布

阅读量857

点赞数

分类专栏：语音识别（声纹识别）文章标签： python 计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43198122/article/details/121156251

版权

语音识别（声纹识别）专栏收录该内容

23 篇文章 94 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了在音频处理中，如何通过频域和时域增强来增加数据多样性。通常，图像增强包括旋转和裁剪，但音频因其时序性不能直接应用相同方法。通过加噪处理后，对提取的固定形状音频特征进行增强。频域和时域增强主要涉及在梅尔语谱特征的横轴（时域）和纵轴（频域）上进行随机mask操作，然后用同一数值覆盖选定区域。文章提供了相关代码示例，输入形状为[batch, fre_feature, time]。" 114053071,10296280,Spring框架实战：构建Java Web项目,"['Java', 'Spring框架', 'Web开发', '依赖注入', '企业级应用']

摘要由CSDN通过智能技术生成

目录

源码

在对图像进行训练时，通常会对图像进行旋转或者随机裁剪，这样是为了增加数据的多样性，但是音频数据却无法直接这么处理，这是因为音频是具有时序性，我们可以通过简单的加噪处理来对音频做一个简单的增强，这是在原始音频基础上的，之后我们对音频提取的特征shape是固定的，此时我们可以对提取出的特征来进行增强，比较常见的就是频域和时域的增强，那么如何理解频域和时域的增强呢，来看下面这幅图：

在这里插入图片描述

这幅图是我对一段11秒的音频进行梅尔语谱特征提取出来的结果，横轴即为时域，纵轴即为频域，那么所谓的时域增强和频域增强无非就是在横轴和纵轴随机mask，mask首先确定维度，然后再用同一个数值覆盖即可，如下图：
在这里插入图片描述

如此便完成啦！代码如下：

源码

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

码匀 CSDN认证博客专家 CSDN认证企业博客

码龄6年

142: 原创

2万+: 周排名

140万+: 总排名

39万+: 访问

: 等级

2745: 积分

2575: 粉丝

292: 获赞

124: 评论

1182: 收藏

私信

关注

热门文章

分类专栏

最新评论

图神经网络的训练方式分类理解（Inductive learning VS Transductive learning）
RK0001: 博主你好，想探讨一个问题。如果transductive learning以时间来构建，数据集的构建方式是怎样的呢？比如说训练集我用2015-2019年的情况，每年都会有新增节点。我直接将2015-2018年的边作为消息边，2019年的边作为监督边是否合理呢？另外，因为监督边中存在的部分节点在构成消息边的节点集中从未出现过，是否需要加一个虚拟节点以和所有节点相连来确保message passing？
图神经网络的训练方式分类理解（Inductive learning VS Transductive learning）
Miqioso?!: 请问反过来的话，在测试过程中，测试节点采样的邻居也有可能是训练节点吗？如果采到训练节点可以使用吗，还是要去除？
GCN笔记-GCN有向图无向图问题
码匀: 可以把有向图当做无向图来处理，不考虑有向图方向
GCN笔记-GCN有向图无向图问题
Joy6A: 意思是GCN的频域卷积只适合处理无向图吗
将pycharm打印出来的东西保存到txt
码匀: output那里

大家在看

绝缘子缺陷检测数据集 295

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

码匀 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。