Python算法练习(十)// 算法:随机森林(分类),数据集:Wine

一、练习目标
1、通过练习掌握随机森林分类的应用,分析参数调整对结果的影响。
2、区分随机森林分类与决策树分类的差别。建立最优的分类预测模型。
3、通过数据挖掘了解影响红酒标签(三分类)的关键特征。

二、重要结论
1、探索数据发现,在小提琴图中可直观看出①特征proline,当取值大于1000,基本可以判断样本属于标签0; ②特征od280/od315_of_diluted_wines,当取值小于1.5,基本可以判断样本属于标签3。
2、采用决策树算法,模型存在明显的过拟合问题。
3、采用随机森林分类算法,①纠正决策树天生过拟合的倾向,②提高模型预测的准确率。
4、采用决策树算法得到的关键特征,与采用随机森林分类算法得到的关键特征,明显不一样。这大概就是红酒的魅力!

三、练习步骤:
(一)导入数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
(二)探索数据

  • 1
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值