Sklearn

Tutu—ren

于 2024-06-28 02:57:19 发布

阅读量357

点赞数 3

文章标签：深入Scikit-learn：掌握Python最强大的机器学习库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43043777/article/details/140029559

版权

获取datasets中的数据
2将数据集划分为训练集和测试集

分为训练集和测试集以及二者标签

3使用sklearn转换器转换处理数据

用pandas得定义函数，但是sklearn这里直接提供

生成得规则(取属性得最值等)是对训练集得取值，在转换测试集时可能出现异常值，因为二者得数据有差异
4构建并评价聚类模型
4.1构建

4.2评估
需要指的是样本得实际标签

对轮廓系数而言
key进行变动,作图找畸变最严重得就是最合适得

5构建并评价分类模型

Python复制代码

from sklearn.datasets import load_iris

from sklearn.tree import DecisionTreeClassifier

from sklearn.model_selection import train_test_split

#数据得准备

iris=load_iris(return_X_y=True) #自变量和标签，返回得是元组，而不是字典了

X=iris[0]

y=iris[1]

X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,stratify=y) #=y分层抽样

clf=DecisionTreeClassifier() #实例化决策树分类器

clf.fit(X_train,y_train) #调用fit方法进行模型训练

print(clf)

print(clf.classes_)

print(clf.feature_importances_)

#每个属性贡献的重要程度

# [0.01189024 0. 0.0453772 0.94273256]

print(clf.predict(X_test)) #测试样本得预测标签,调用模型对测试样本进行预测

# [0 0 2 2 2 2 2 1 0 1 2 0 2 2 1 1 1 2 0 2 1 0 0 1 0 1 0 0 2 1]

print(y_test) #[0 0 2 1 2 1 1 1 0 1 1 2 0 0 2 0 2 0 0 2 2 1 0 2 2 2 1 1 1 0]

#将预测结果与实际结果进行比对

print((clf.predict(X_test)==y_test).mean()) #0.9指标

from sklearn.metrics import classification_report

report=classification_report(y_test,clf.predict(X_test))

print(report)

#评估报告

# precision recall f1-score support

#

# 0 1.00 1.00 1.00 10

# 1 0.91 1.00 0.95 10

# 2 1.00 0.90 0.95 10

#

# avg / total 0.97 0.97 0.97 30

6回归模型的构建

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Sklearn

X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,stratify=y) #=y分层抽样。iris=load_iris(return_X_y=True) #自变量和标签，返回得是元组，而不是字典了。print(clf.predict(X_test)) #测试样本得预测标签,调用模型对测试样本进行预测。print((clf.predict(X_test)==y_test).mean()) #0.9指标。Python复制代码。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。