机器学习PAI通过声音分辨男女(含语音特征提取相关数据和代码)

dicyt

于 2017-09-28 17:02:26 发布

阅读量370

点赞数

文章标签：人工智能 r语言数据结构与算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dicyt/article/details/84909714

版权

本文通过R的warbleR包提取声音信号特征，结合阿里云PAI训练男女声音分类模型，实现高准确率的性别识别。实验包括声音特征提取、数据导入PAI、SVM模型建立与评估，最终准确率约98%。

摘要由CSDN通过智能技术生成

摘要：机器学习PAI通过声音数据分辨男女（含语音特征提取相关数据和代码）

背景

随着人工智能的算法发展，对于非结构化数据的处理能力越来越受到重视，这里面的关键一环就是语音数据的处理。目前，许多关于语音识别的应用案例已经影响着我们的生活，例如一些智能音箱中利用语音发送指令，一些搜索工具利用语音输出文本代替键盘录入。

本文我们将针对语音识别中最简单的案例“男女声音”识别，结合本地的R工具以及机器学习PAI，为大家进行介绍。通过本案例，可以将任何用户的语音数据标记出性别，并且保持高准确率。我们把整个实验流程切分为两部分，第一部分是声音信号的特征提取，通过R的信号处理工具实现；第二部分通过机器学习PAI实现男女声音分类模型的训练，本实验需要事先积累男女声音的录音数据，本文已经提供处理好的3000条语音数据，文章末尾提供下载。

声音信号特征提取

语音数据与图像数据以及文本数据不同，如果经常使用K歌软件或者是语音合成软件，不难理解语音数据通常成信号状分布。为了有效的通过算法处理这种波形数据，需要首先通过信号处理工具对语音信号进行处理。本文我们选用的是R语言的warbleR包，warbleR包含大

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。