最近在做tensorflow,发现tensorflow可以自动下载数据集,这样导入会方便很多,然后用了一次sklearn,就找了一下sklearn有没有这个自动下载数据集的函数,结果发现还真有,下面做一介绍:
sklearn的数据集分为以下几种:
自带的小数据集(packaged dataset):sklearn.datasets.load_
可在线下载的数据集(Downloaded Dataset):sklearn.datasets.fetch_
计算机生成的数据集(Generated Dataset):sklearn.datasets.make_
svmlight/libsvm格式的数据集:sklearn.datasets.load_svmlight_file(…)
从买了data.org在线下载获取的数据集:sklearn.datasets.fetch_mldata(…)
(这几类我也不知道,是参考这篇博客的,链接:博客地址)
然后我这里用了一个加州房价的数据集,所以用的是第二个
sklearn.datasets.fetch_california_housing()
参考上面的格式,即可自动下载数据集,而且导入的时候直接用就行,不会二次下载,非常方便。
sklearn自动下载数据集
最新推荐文章于 2024-05-10 09:41:17 发布