新手做深度学习项目-话者识别系统

最新推荐文章于 2024-06-04 07:50:53 发布

William张

最新推荐文章于 2024-06-04 07:50:53 发布

阅读量2.5k

点赞数 5

分类专栏：深度学习文章标签：深度学习话者识别新手

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MrWilliamVs/article/details/77131340

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本科毕业设计选的是”基于深度学习的话者识别系统“题目，没接触过深度学习，也不懂话者识别是什么意思，尴尬，只能硬着头皮去一点一点啃了。

这里我总结一下，我做完这个项目之后，对话者识别这个领域，对深度学习这个方向学习的所感所得，分享给大家。

关于话者识别

通过看论文，发现，话者识别在2016年之前，还是停留在用ivector、GMM-UBM，这些简单的机器学习模型，然后用PLDA降维优化；2016年之后，可能深度学习在这个时候忽然间火起来了，有一些学者将DNN（深度神经网络）应用到了话者识别系统中去了，只是简单的用了下DNN ，并没有过多的去优化。

下面，我总结下，我的毕设的工作，如下图所示。
这里写图片描述

数据处理

前期，大量的工作就是语音数据的处理，训练集，测试集的生成，将语音文件处理成自己需要的形式-语谱图；

模型

明确模型的输入输出，直接在机器上运行就可以了；
观察结果，然后调节参数。

在使用CNN时，调节了输入的语谱图，对其归一化处理，然后调节了CNN中的全连接层参数。 最终，识别效果得到了大幅度提升。

residual network是imagenet夺冠的一个神经网络模型，16年火起来的，因此，也拿来用到了话者识别系统中去。毕竟我们的语音是转成图像处理的，效果很显著。

关于深度学习

对于深度学习，我也是新手，接触不久，接下来我会在这个方向一直深入做下去，也会写更多关于深度学习的文章分享给大家。

写一些关于自己对深度学习的小感悟吧。
对于新手，要先学会去用。先不用理会内部的逻辑，明确输入输出是什么就可以。网上对于常见的深度学习网络开源的太多了，github上，输入cnn,rnn，等等，就能找到好多，下载下来简单修改下就可以运行。
新手可以尝试keras框架，它是在tensorflow基础上封装的更高层的深度学习框架。使用起来更简单方便。tensorflow可能搞起来难度更大一些。

玩过几个项目之后，熟悉了整个流程，可以去深入学习tensorflow框架，深入去学习每一种神经网络的结构。

这里给大家分享一本深度学习的书，市面上仅有的一本，目前应该还只有电子版。
链接：http://pan.baidu.com/s/1o8KAVWI 密码：bnc9

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
5
评论
新手做深度学习项目-话者识别系统

本科毕业设计选的是”基于深度学习的话者识别系统“题目，没接触过深度学习，也不懂话者识别是什么意思，尴尬，只能硬着头皮去一点一点啃了。这里我总结一下，我做完这个项目之后，对话者识别这个领域，对深度学习这个方向学习的所感所得，分享给大家。关于话者识别通过看论文，发现，话者识别在2016年之前，还是停留在用ivector、GMM-UBM，这些简单的机器学习模型，然后用PLDA降维优化；2016年之后，可能
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。