从sklearn机器学习库导入datasets数据集,这里面提供了很多不同的数据集,主要包含以下几大类:
- 玩具数据集
波士顿房价boston,鸢尾花iris,糖尿病diabetes,手写数字mnist,,,,,等等,加载方式:datasets.load_xxx(),直接这种格式就行,无需从外部网站下载
- 真实世界中的数据集
较大数据集,必要时可以在线下载,用datasets.fetch_xx()加载,也就是他是最近几年的真实收集的数据,不是练习入门的数据集,你也可以下载在线的,也可以自己收集
- 样本生成器
- 样本图片
- svmlight或libsvm格式的数据
可以加载svmlight / libsvm格式的数据集。网址:https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/,
- 从http://openml.org下载的数据
openml.org 是一个用于机器学习数据和实验的公共存储库,它允许每个人上传开放的数据集,可以通过sklearn.datasets.fetch_openml()函数来从openml.org下载数据集。
- 从外部加载的数据****
sklearn之datasets数据集
最新推荐文章于 2023-12-09 22:11:56 发布