《Python数据分析与应用》第6章 使用sklearn构建模型 实训部分

《Python数据分析与应用》第6章 使用sklearn构建模型 实训部分((源于大学课程python数据分析))

实训1 使用sklearn处理wine和wine_quality数据集

1.使用pandas库分别读取wine数据集在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2.将wine数据集和wine_quality数据集的数据和标签拆分开
拆分wine数据集
在这里插入图片描述
和wine_quality数据集
在这里插入图片描述
3.将wine,wine_quality数据集划分为训练集和测试集
在这里插入图片描述
在这里插入图片描述
4.标准化wine数据集和wine_quality数据集
在这里插入图片描述
在这里插入图片描述
5.对wine数据集和wine_quality数据集进行PCA降维
在这里插入图片描述
在这里插入图片描述

实训2 构建基于wine数据集的K-Means聚类模型

1.构建聚类数目为3的K-Means模型
在这里插入图片描述在这里插入图片描述
2.对比真实标签和聚类标签求取FMI
在这里插入图片描述
3.在聚类数目为2-10类时,确定最优聚类数目
在这里插入图片描述
结果表明最优聚类数目为3类
4.求取模型的轮廓系数,绘制轮廓系数折线图,确定最优聚类数目
在这里插入图片描述
在这里插入图片描述
由上图所示,k=7时,畸变程度最大,所以最优聚类数目为7
5.求取Calinski—Harabasz指数,确定最优聚类数目
在这里插入图片描述
如上显示k=2时,数值较大,因此最优聚类数目为2

实训3 构建基于wine数据集的SVM分类模型

1.读取wine数据集,区分标签和数据
在这里插入图片描述
2.将wine数据集划分为训练集和测试集
在这里插入图片描述
3.使用离差标准化方法标准化wine数据集
在这里插入图片描述
4.构建SVM模型,并预测测试集结果
在这里插入图片描述
在这里插入图片描述
5.打印出分类报告,评价分类模型性能
在这里插入图片描述
准确率和Cohen’s Kappa系数一定程度是接近1,该分类模型性能较好

实训4 构建基于wine_quality数据集的回归模型

在这里插入图片描述
1.根据wine_quality数据集处理的结果,构建线性回归模型
在这里插入图片描述
2.根据wine_quality数据集处理的结果,构建梯度提升回归模型
在这里插入图片描述
3.结合真实评分和预测评分,计算均方误差、中值绝对误差、可解释方差
在这里插入图片描述
在这里插入图片描述
4.根据得分,判定模型的性能优劣
由于上可知,平均绝对误差、均方误差、中值绝对误差,梯度提升回归模型均比线性模型更接近0,可解释方差值、回归R方值梯度,提升回归模型均比线性模型更接近1,因此梯度提升回归模型优于线性回归模型

  • 13
    点赞
  • 130
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

freetozn

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值