python机器学习—语音性别识别代码详解(调参,预测)

本人机器学习的一个小作业,挺简单的。希望可以帮到一些入门的小伙伴,当个练手啦!
项目介绍,根据给定的特征来预测是女生还是男生
模型选择的是随机森林,训练集上准确率百分之百,验证集上百分之97.9。
代码分为训练模型(调参和训练)和使用模型进行预测,训练好模型后对新的数据进行的预测,并将预测的结果保存在了result.txt文件中。
软件:anaconda3—jupyter Notebook
用到的数据集 链接: https://pan.baidu.com/s/10LoGDcHDCnjNz4PQpli_Gg
提取码: s3eh

一.数据集介绍

首先介绍一下我所使用的数据集:
每条数据可视作一个长度为21的一维数组。
其中前20个数值是这条语音的20个特征值,这些特征值包括了语音信号的长度、基频、标准差等;最后一个数值是性别标记。用0表示男性、1表示女性。(如下图所示)
train.csv训练集2300条(用于模型训练,有标签)
在这里插入图片描述
test.csv测试集包含 800条(无标签)

在这里插入图片描述

二.代码

模型参数选择

随机森林的基评估器是决策树,单棵决策树的准确率越高,随机森林的准确 率也会越高,因为装袋法是依赖于平均值或者少数服从多数的原则来决定集成结 果的。但决策树很容易过拟合。所以根据参数对模型的影响大小,进行调参。
(1)调参,决策树个数的选取(画学习曲线)
在这里插入图片描述
结果
在这里插入图片描述
根据上面的结果缩小决策树个数的范围,继续调参

  • 5
    点赞
  • 54
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值