使用scikit-learn构建模型

一、使用scikit-learn构建模型
1.加载datasets模块中数据集
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

2.将数据集划分为训练集和测试集在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

3.使用sklearn转换器进行数据预处理与降维
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
二、构建并评估聚类模型
1.使用sklearn估计器构建聚类模型
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述在这里插入图片描述

2.评价聚类模型在这里插入图片描述
在这里插入图片描述
轮廓系数法不能数据较大,会报错,计算量太大,无法在电脑上运行,可改用指数评价法在这里插入图片描述
三、构建并评估分类模型
1.使用sklearn估计器构建分类模型
在这里插入图片描述
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.评价分类模型在这里插入图片描述TP(True Positives)意思就是被分为了正样本,而且分对了。
TN(True Negatives)意思就是被分为了负样本,而且分对了,
FP(False Positives)意思就是事实上这个样本是负样本,但是你当成正的了。(误报)
FN(False Negatives)意思就是事实上这个样本是正样本,但是你没识别出来。(漏报)

precision(精确度)
Precision=TP/(TP+FP)
precision可以理解为“模型认为正确且确实是正确的样本占模型认为正确的所有样本的概率”

recall(召回率)
Recall=TP/(TP+FN)
recall可以理解为“模型认为是正确且确实是真确的样本占所有正确的样本的概率”

F1值
用来衡量二分类模型精确度的一种指标。它同时兼顾了分类模型的准确率和召回率。F1分数可以看作是模型准确率和召回率的一种加权平均,它的最大值是1,最小值是0。

在这里插入图片描述在这里插入图片描述
绘制roc曲线
(tpr,fpr,thershold)

tpr:根据不同阈值得到一组tpr值。

fpr:根据不同阈值的到一组fpr值,与tpr一一对应。(这两个值就是绘制ROC曲线的关键)

thresholds:选择的不同阈值,按照降序排列。
在这里插入图片描述

四、构建并评价回归模型
1.使用sklearn估计器构建回归模型在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述

2.评价回归模型在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值