Speech Enhancement Generation Adversarial Network

最新推荐文章于 2024-07-28 20:47:48 发布

小草莓lllll

最新推荐文章于 2024-07-28 20:47:48 发布

阅读量2.6k

点赞数 2

分类专栏：语音增强神经网络深度学习文章标签：语音增强神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31196849/article/details/77931306

版权

本文介绍了GAN网络在语音增强领域的应用，探讨了SEGAN（语音增强生成对抗网络）的优势，如无需递归操作，端到端处理，以及在不同讲话者和噪音类型中的学习能力。同时，阐述了GAN的训练过程和优化目标，讨论了训练方法和测试中遇到的问题，如音频失真。最后，提到了其他新兴的语音增强技术，并提供了相关研究文章链接供进一步阅读。

摘要由CSDN通过智能技术生成

GAN网络简述

GAN网络于2014年由 Ian Goodfellow教授在论文Generative Adversarial Nets中提出，是一种训练生成式模型的新方法，目前多用于图像分类（以下用图像举例）。
GAN网络包含了两个对抗模型：生成模型（G）输入为带噪图片，输出产生一个看起来像真的图片，迷惑判别模型；判别模型（D）用于判断一个给定的图片是不是真实的图片（包括从数据集里获取的图片和生成网络的输出图片）。在刚开始时，两个模型都是没有经过训练的，两个模型一起对抗训练，生成模型产生一章图片去欺骗判别模型，然后判别模型去判断这张图片的真假，最终两个模型能力越来越强，达到稳态。

另外，GANs一些新的应用在下面这篇博文中有所介绍，都是一些比较新的idea：
https://adeshpande3.github.io/adeshpande3.github.io/Deep-Learning-Research-Review-Week-1-Generative-Adversarial-Nets

GAN网络应用于语音增强

原理概述<

最低0.47元/天解锁文章

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。