『数据加载』之玩具数据集

最新推荐文章于 2024-11-13 22:53:21 发布

Danielle__

最新推荐文章于 2024-11-13 22:53:21 发布

阅读量1.1k

点赞数 11

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Danielle__/article/details/134901844

版权

本文介绍了机器学习中常用的6个经典数据集，包括鸢尾花、糖尿病、手写数字、林纳鲁德、葡萄酒和威斯康星州乳腺癌数据集，详细讲解了每个数据集的加载方式、数据概况和应用场景，这些数据集适用于多种机器学习算法的测试和学习。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

机器学习的第一步是准备数据，好的数据能帮助我们加深对机器学习算法的理解。

不管是在学习还是实际工作中，准备数据永远是一个枯燥乏味的步骤。
scikit-learn库显然看到了这个痛点，才在它的数据加载子模块中为我们准备了直接可用的数据集。

在它的数据加载子模块中，提供了6种直接可用来学习算法的经典数据集，被称为 Toy Datasets，
也就是本篇准备介绍的玩具数据集。

1. 鸢尾花数据集

著名的鸢尾花数据集，最初由R.A.费舍尔爵士使用。
数据集取自费舍尔的论文。

1.1. 加载方式

from sklearn.datasets import load_iris

# 加载后的数据集 ds 是一个字典
ds = load_iris()
ds

直接的返回的字典中，除了数据还包含一些描述数据的元信息。
如果想要直接得到用于分析的数据，加载时设置如下的参数：

# as_frame 参数将数据部分设为pandas的Dataframe格式
# return_X_y 参数表示返回 (data, target) 格式
ds = load_iris(as_frame=True, return_X_y=True)

ds[0]  # Dataframe格式的数据

1.2. 数据概况

鸢尾花数据集是一个简单的多级分类数据集。

概况	说明
样本分类	3种
每种分类样本数	50
样本总数	150
样本维度	4
样本特征	`real`,

最低0.47元/天解锁文章

博客等级

码龄3年

23
原创

69
点赞

96
收藏

53
粉丝

关注

私信

热门文章

最新评论

推荐一款好用的代码可视化工具
CSDN-Ada助手: 恭喜你写了第20篇博客！看到你推荐了一款好用的代码可视化工具，我觉得非常实用，谢谢你的分享。希望你能继续保持创作的热情，可以考虑写一些实际应用案例或者分享一些代码优化的经验，这样能够更好地帮助到大家。期待你的下一篇文章，加油！
微分方程matlab求解
CSDN-Ada助手: 恭喜您写了第19篇博客！标题中的“微分方程matlab求解”引起了我的兴趣。我很高兴看到您持续创作，分享关于微分方程求解的知识。在您的下一篇博客中，也许您可以考虑探讨一些常见的微分方程类型，或者分享一些解决复杂微分方程的技巧。希望您能继续保持创作的热情，并且愿意与我们分享更多有关微分方程求解的知识。
使用mumu模拟器抓包 andriod app
CSDN-Ada助手: 恭喜您撰写第17篇博客！标题中的"使用mumu模拟器抓包 andriod app"让我非常感兴趣。您的经验分享对于那些希望学习如何使用mumu模拟器来进行抓包的读者们来说，无疑是一份宝贵的资源。我非常期待您在下一篇博客中能够继续分享关于mumu模拟器抓包的更多技巧和经验。或许您可以深入探讨如何分析抓包数据、提供一些实用的案例，或者分享一些解决常见问题的方法。我相信这些内容将为读者们提供更多的帮助和指导。谦逊地说，我知道写作需要时间和精力，所以请您尽量按照自己的节奏进行创作。感谢您不断分享您的知识和经验，期待您未来更多的博客！
构建智能问答系统
CSDN-Ada助手: 恭喜您在构建智能问答系统方面取得了新的进展！您的博客内容一直都很有深度，对于技术方面的讨论总是能够给读者带来新的启发。希望您可以在下一篇博客中分享一些具体的案例分析或者实际操作经验，这样会更加有助于读者理解和应用您所介绍的内容。期待您的下一篇精彩文章！
数值求解算法
CSDN-Ada助手: 恭喜您发布了关于“数值求解算法”的第15篇博客！您的持续创作展现了您对这一主题的深入研究和热情。希望您可以继续分享更多关于算法的见解和经验，也许可以考虑写一些实际案例或者应用场景的分析，让读者更好地理解和应用这些数值求解算法。期待您的下一篇作品！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。