机器学习(5)--数据集划分

最新推荐文章于 2024-05-26 07:59:09 发布

Ona_Soton

最新推荐文章于 2024-05-26 07:59:09 发布

阅读量2.9k

点赞数 1

分类专栏：机器学习文章标签： sklearn 机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ona_Soton/article/details/120427189

版权

sklearn数据集

1、数据集划分

2、sklearn数据集接口介绍

3、 sklearn分类数据集

4、 sklearn回归数据集

数据集划分

机器学习一般的数据集会划分为两个部分：

训练数据：用于训练，构建模型

测试数据：在模型检验时使用，用于评估模型是否有效【不同模型评估方式不同】

【常用比例是：75%:25%】

语法：

sklearn数据集划分API

sklearn.model_selection.train_test_split

sklearn.datasets
加载获取流行数据集
datasets.load_*()
获取小规模数据集，数据包含在datasets里

datasets.fetch_*(data_home=None)
获取大规模数据集，需要从网络上下载，函数的第一个参数是data_home，表示数据集下载的目录,默认是 ~/scikit_learn_data/

sklearn获取数据格式

load*和fetch*返回的数据类型datasets.base.Bunch(字典格式)

data：特征数据数组，是 [n_samples * n_features] 的二维
numpy.ndarray 数组

target：标签数组，是 n_samples 的一维 numpy.ndarray 数组

DESCR：数据描述

feature_names：特征名【新闻数据，手写数字、回归数据集没有】

target_names：标

最低0.47元/天解锁文章

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
机器学习(5)--数据集划分

sklearn数据集1、数据集划分2、sklearn数据集接口介绍3、 sklearn分类数据集4、 sklearn回归数据集数据集划分机器学习一般的数据集会划分为两个部分：训练数据：用于训练，构建模型测试数据：在模型检验时使用，用于评估模型是否有效【不同模型评估方式不同】【常用比例是：75%:25%】语法：sklearn数据集划分APIsklearn.model_selection.train_test_splitsklearn.datasets.
复制链接

扫一扫

专栏目录

Ona_Soton CSDN认证博客专家 CSDN认证企业博客

码龄3年

36: 原创

52万+: 周排名

183万+: 总排名

4万+: 访问

: 等级

372: 积分

62: 粉丝

11: 获赞

0: 评论

103: 收藏

私信

关注

热门文章

分类专栏

机器学习 23篇
Python 11篇
高数 2篇

最新评论

机器学习三个核心理论
performance_ecna: 开源代码》》机器学习—朴素贝叶斯算法：假设原理+思维脑图+代码实操+优劣对比+经验总结 https://v.douyin.com/kmFXyeG/

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。