sklearn数据集的使用

最新推荐文章于 2023-10-07 14:29:10 发布

鹰眼2号

最新推荐文章于 2023-10-07 14:29:10 发布

阅读量1.6k

点赞数

分类专栏： sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35810838/article/details/88689095

版权

机器学习一般的数据会划分为两个部分：

训练数据：用于训练，构建模型（75%）

测试数据：在模型检查时使用，用于评估模型是否有效（25%）

数据划分API: sklearn.model_selection.train_test_split（）返回数据的类型的顺序（训练数据特征，测试数据特征，训练数据目标值，测试数据的目标值），这个顺序必须一致，不能改变。

获取数据API:

sklearn.datasets 加载获取流行数据集

datasets.load_*() 获取小规模数据集，数据包含在datasets里【xp: sklearn.datasets.load_iris() 返回尾花数据集

datasets.fetch_*(data_home=None) 获取大规模数据集，需要从网络上下载，函数的第一个参数是data_home,表示数据集下在的目录，默认是~/scikit_learn_data/

返回的数据的格式

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
sklearn数据集的使用

机器学习一般的数据会划分为两个部分：训练数据：用于训练，构建模型（75%）测试数据：在模型检查时使用，用于评估模型是否有效（25%）数据划分API: sklearn.model_selection.train_test_split（）返回数据的类型的顺序（训练数据特征，测试数据特征，训练数据目标值，测试数据的目标值），这个顺序必须一致，不能改变。获取数据API:skl...
复制链接

扫一扫

专栏目录

鹰眼2号 CSDN认证博客专家 CSDN认证企业博客

码龄8年

211: 原创

24万+: 周排名

196万+: 总排名

32万+: 访问

: 等级

3814: 积分

31: 粉丝

108: 获赞

26: 评论

414: 收藏

私信

关注

分类专栏

shell 7篇
python爬虫 25篇
python 30篇
区块链
python-常用算法
python数据结构 1篇
python算法 5篇
面试 2篇
WEB 7篇
Mysql 5篇
Mongodb 4篇
github 2篇
tornado 15篇
Redis 1篇
LPC201X 1篇
office 2篇
喜欢你 4篇
numpy 5篇
嵌入式 3篇
数据可视化 7篇
疑问
数据分析 4篇
flask 1篇
Django 1篇
sklearn 5篇
查漏 1篇
计算机基础 3篇
pandas 4篇
黑客
Tensorflow复习

最新评论

js中call()方法的用法
晴天Onlive: 额，一坨答辩
js中call()方法的用法
qq_42800417: 个人理解，属实是感觉说了很多，但是等于没说了。 .call本质等于是让sub调用了add方法，而不需要给sub对象写一个add方法。
js中call()方法的用法
Daes: 这写的有点垃圾。本身call执行只是改变this指向的。别耽误人
js中call()方法的用法
MRDONG1: 服了，被你误导了，箭头函数里能用call方法吗？普通函数是谁调用this指向谁，箭头函数都没有this
机器码与字节码的区别
软院少女不秃头: 终于理解机器码与字节码啦！感谢！最后一句很有用

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。