3.sklearn库中的标准数据集及基本功能
数据集总览
数据集大小 | 数据集名称 | 调用方式 | 适用算法 | 数据规模 |
---|---|---|---|---|
小数据集 | 波士顿房价数据集 | load_boston() | 回归 | 506*13 |
– | 鸢尾花数据集 | load_iris() | 分类 | 150*4 |
– | 糖尿病数据集 | load_diabetes() | 回归 | 442*10 |
– | 手写数字数据集 | load_digits() | 分类 | 5620*64 |
大数据集 | Olivetti脸部图像数据集 | fetch_olivetti_faces() | 降维 | 400 * 64 * 64 |
– | 新闻分类数据集 | fetch——20newsgroups() | 分类 | - |
– | 带标签的人脸数据集 | fetch_lfw_people() | 分类;降维 | - |
– | 路透社新闻语料数据集 | fetch_revl() | 分类 | 804414*47236 |
注:小数据集可以直接使用,大数据集要在调用程序时自动下载(一次即可)