UCI数据集是一个常用的机器学习标准测试数据集。 地址: http://www.ics.uci.edu/~mlearn
以Iris鸢尾花数据集为例:
1.Iris数据集在右边方框【Most Popular Data Sets (hits since 2007)】中第一个。
2.点击Iris数据集,进入该数据集详情页面:
上面是这个数据集的详细信息:多变量数据集,没有缺失值,也许是模式识别文献中最著名的数据集等等,再往下是与该数据集相关的一些论文。
3.回到上面的图片处,左边【Data Folder】是存放该数据集的位置,【Data Set Description】是数据集的描述,点击进入【Data Folder】。
4.该文件夹中有三个文件:【Index】、【iris.data】和【iris.names】(忽略【bezdekIris.data】)。
Index为文件夹目录,列出了本文件夹里的所有文件。如iris中index的内容如下:
Index of iris
02 Dec 1996 105 Index