数据分析入门——scikit-learn模型

最新推荐文章于 2024-05-17 17:42:50 发布

Echoblabla

最新推荐文章于 2024-05-17 17:42:50 发布

阅读量526

点赞数

分类专栏： python 文章标签： python 聚类

本文链接：https://blog.csdn.net/Echoblabla/article/details/107314811

版权

python 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

scikit-learn模型数据集加载函数解释

在这里插入图片描述
数据集的划分

k折交叉验证

划分训练集和测试集的函数
的

from sklearn.model_selection import train_test_split
train_data,teat_data,train_target,test_target=train_test _split(data['data'],data['target'],test_size=0.2)

sklearn转换器

在这里插入图片描述
的

from sklearn.preprocessing import minmaxscaler
model=minmaxscaler().fit(train_data)
train_data1=model.transform(train_data)
test_data1=model.transform(test_data)

PCA降维算法
在这里插入图片描述
的

from sklearn.decomposition import PCA
model=PCA(n_compositions=8).fit(train_data_mms)
train_data2=model.transform(train_data)
test_data2=model.transform(test_data)

使用sklearn构建聚类模型

聚类类型：
在这里插入图片描述
使用k-means聚类：

from sklearn.datasets import load_iris
from sklearn.cluster import KMeans
data=load_iris()
model=KMeans(n_cluster=3).fit(data['data'])
#查看聚类中心
model.cluster_centers_
#使用散点图查看
import maplotlib.pyplot as plt
for i in range(3):
 plt.scatter(data['data'][model.labels_==i,0],data['data'][model.labels_==i,1])
 plt.show()

聚类模型的评价指标
在这里插入图片描述
使用轮廓系数评价那种k的效果最好

from sklearn.datasets import load_iris
from sklearn.metrics import Silhouette_score
for k in range(2,9):
 model=KMeans(n_clusters=k).fit(data['data'])
print(k,silhouette_score(data['data'],model.labels)

在这里插入图片描述

sklearn构建分类模型

在这里插入图片描述
使用支持向量机构建分类模型

#数据导入
#划分训练集、测试集
#模型预处理：查看模型的最大值最小值是否进行标准化、归一化
#分类模型的构建
from sklearn.svm import SVC
model=SVC().fit(x_train2,y_train)
model.predict(x_test2)
#判断模型的准确率
model.score(x_test2,y_test)

分类模型的评价指标
在这里插入图片描述
的

from sklearn.metrics import recall_score,precision_score,f1_score,roc_curve
print(recall_score(y_test,y_pre))
#roc_curve绘制
fqr,tqr,thresholds=roc_curve(y_test,y_pre)
import matplotlib.pyplot as plt
plt.plot(fpr,tqr)
plt.show()

构建回归模型

在这里插入图片描述

的

from sklearn.linear_model import linearRegression
model=linearregression().fit(x_train,y_train）
y_pre=model.predict(x_test)

评价指标
在这里插入图片描述
dd

from sklearn.metrics import mean_squared_error,r2_score
mean_squared_error(y_true=y_test,y_pred=y_pre)

Echoblabla

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录