sklearn数据集(分类、回归)与转换器、估计器

文章介绍了如何使用Scikit-Learn库加载和处理数据集,包括分类和回归数据集的划分,如Iris和Boston房价数据。通过train_test_split函数进行训练集和测试集的分割,并展示了大数据集如20Newsgroups的使用。此外,还提及了转换器和估计器在机器学习流程中的作用。
摘要由CSDN通过智能技术生成

目录

sklearn数据集

数据集划分

scikit-learn数据集API介绍

获取数据集返回的类型

sklearn分类数据集

数据集进行分割

用于分类的大数据集

sklearn回归数据集

转换器与估计器


sklearn数据集

数据集划分

机器学习一般的数据集会划分为两个部分:

训练数据:用于训练,构建模型

测试数据:在模型检验时使用,用于评估模型是否有效

scikit-learn数据集API介绍

获取数据集返回的类型

sklearn分类数据集

from sklearn.datasets import load_iris

li = load_iris()

print("获取特征值")
print(li.data)
print("目标值")
print(li.target)

数据集进行分割

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

li = load_iris()

# 注意返回值,训练集 train x_train y_train,测试集 test x_test y_test
x_train, x_test, y_train, y_test = train_test_split(li.data,li.traget,test_size=0.25)

print("训练集特征值和目标值:",x_train, y_train)
print("测试集特征值和目标值:",x_test, y_test)

用于分类的大数据集

from sklearn.datasets import load_iris, fetch_20newsgroups
from sklearn.model_selection import train_test_split

li = load_iris()

news = fetch_20newsgroups(subset='all')

print(news.data)
print(news.target)

sklearn回归数据集

from sklearn.datasets import load_iris, fetch_20newsgroups, load_boston
from sklearn.model_selection import train_test_split

li = load_iris()

lb = load_boston()

print(lb.data)
print(lb.target)
print(lb.DESCR)

转换器与估计器

转换器:

 估计器:

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值