使用scikit-learn构建模型——使用sklearn转换器处理数据

使用sklearn转换器处理数据

  1. 加载datasets模块中的数据集(sklearn自带的数据集)
#加载breast_cancer数据集
from sklearn.datasets import load_breast_cancer
cancer=load_breast_cancer() #将数据集赋值给cancer变量
print('breast_cancer数据集的长度为:',len(cancer))
print('breast_cancer数据集的类型为:',type(cancer))

#sklearn 自带数据集内部信息获取
cancer_data=cancer['data']
print('breast_cancer数据集的数据为:\n',cancer_data)
cancer_target=cancer['target'] #取出数据集的标签
print('breast_cancer数据集的标签为:\n',cancer_target)
cancer_names=cancer['feature_names'] #取出数据集的特征名
print('breast_cancer数据集的特征名为:\n',cancer_names)
cancer_desc=cancer['DESCR'] #取出数据集的描述信息
print('breast_cancer数据集的描述信息为:\n',cancer_desc)
  1. 将数据集划分为训练集和测试集
#使用train_test_split划分数据集
print('原始数据数据集数据的形状:',cancer_data.shape)
print('原始数据数据集标签的形状:',cancer_target.shape)

from sklearn.model_selection import train_test_split
cancer_data_train,cancer_data_test,cancer_target_train,cancer_target_test=\
train_test_split(cancer_data,cancer_target,test_size=0.2,random_state=42)
print('训练集数据的形状为:',cancer_data_train.shape)
print('训练集标签的形状为:',cancer_target_train.shape)
print('测试集数据的形状为:',cancer_data_test.shape)
print('测试集标签的形状为:',cancer_target_test.shape)
  1. 使用sklearn转换器进行数据预处理与降维
#对breast_cancer数据集PCA降
from sklearn.decomposition import PCA
pca_model=PCA(n_components=10).fit(cancer_trainScaler) #生成规则
cancer_trainPca=pca_model.transform(cancer_trainScaler) #将 规则 应用于训练集
cancer_testPca=pca_model.transform(cancer_testScaler) #将 规则 应用于测试集
print('PCA降维 前 训练集数据的形状为:',cancer_trainScaler.shape)
print('PCA降维 后 训练集数据的形状为:',cancer_trainPca.shape)
print('PCA降维 前 测试集数据的形状为:',cancer_testScaler.shape)
print('PCA降维 后 测试集数据的形状为:',cancer_testPca.shape)
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Big-Winda

感谢支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值