UC Irvine Machine Learning Repository:UCI指的是加州大学欧文分校。UCI机器学习库主要是收集的机器学习领域的一些相关数据集和数据生成器,可以用来做一些基本的实验。存档是创建为大卫阿哈和加州大学欧文分校研究员在1987年研究生FTP文件。自那时以来,它已被广泛用于学生,教育工作者,和其他研究机器学习的研究者,作为一个数据来源。
本文是利用UCI machine learning repository的spambase数据集进行垃圾邮件的分类;
数据来源:UCI Machine Learning Repository: Spambase Data Set
3.1 数据描述
Data Set Characteristics: |
Multivariate |
Number of Instances: |
4601 |
Area: |
Computer |
Attribute Characteristics: |
Integer, Real |
Number of Attributes: |
57 |
Date Donated |
1999-07-01 |
Associated Tasks: |
Classification |
Missing Values? |