Sklearn

获取datasets中的数据
2将数据集划分为训练集和测试集

image.png


分为训练集和测试集以及二者标签

image.png


3使用sklearn转换器转换处理数据

image.png


用pandas得定义函数,但是sklearn这里直接提供

image.png


生成得规则(取属性得最值等)是对训练集得取值,在转换测试集时可能出现异常值,因为二者得数据有差异
4构建并评价聚类模型
4.1构建

image.png

image.png

image.png

image.png


4.2评估
需要指的是样本得实际标签

image.png


对轮廓系数而言
key进行变动,作图找畸变最严重得就是最合适得

image.png


5构建并评价分类模型

image.png

Python复制代码

from sklearn.datasets import load_iris

from sklearn.tree import DecisionTreeClassifier

from sklearn.model_selection import train_test_split

#数据得准备

iris=load_iris(return_X_y=True) #自变量和标签,返回得是元组,而不是字典了

X=iris[0]

y=iris[1]

X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,stratify=y) #=y分层抽样

clf=DecisionTreeClassifier() #实例化决策树分类器

clf.fit(X_train,y_train) #调用fit方法进行模型训练

print(clf)

print(clf.classes_)

print(clf.feature_importances_)

#每个属性贡献的重要程度

# [0.01189024 0. 0.0453772 0.94273256]

print(clf.predict(X_test)) #测试样本得预测标签,调用模型对测试样本进行预测

# [0 0 2 2 2 2 2 1 0 1 2 0 2 2 1 1 1 2 0 2 1 0 0 1 0 1 0 0 2 1]

print(y_test) #[0 0 2 1 2 1 1 1 0 1 1 2 0 0 2 0 2 0 0 2 2 1 0 2 2 2 1 1 1 0]

#将预测结果与实际结果进行比对

print((clf.predict(X_test)==y_test).mean()) #0.9指标

from sklearn.metrics import classification_report

report=classification_report(y_test,clf.predict(X_test))

print(report)

#评估报告

# precision recall f1-score support

#

# 0 1.00 1.00 1.00 10

# 1 0.91 1.00 0.95 10

# 2 1.00 0.90 0.95 10

#

# avg / total 0.97 0.97 0.97 30

6回归模型的构建

image.png

image.png

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值