1
/
5
WEKA
对
wisconsin-breast-cancer
数据挖掘分析报告
一、
数据集
实验采用
UCI
数据集中的
Wisconsin
医学院的
William
H.Wolberg
博士提供的乳腺
癌
的
数
据
样
本
(
http://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wi
sconsin/
)
。
所有数据来自真实临床案例,
每个案例有
10
个属性。
其中前九个属性是检
测指标,
每个属性值用
1
到
10
的整数表示,
1
表示检测指标最正常,
10
表示最不正常。
第十个属性是分类属性,
指示该肿瘤是否为恶性。
数据集中的肿瘤性质是通过活检得出
的结果。
肿块厚度
Clump_Thickness integer [1,10]
细胞大小的均匀性
Cell_Size_Uniformity integer [1,10]
细胞形状的均匀性
Cell_Shape_Uniformity intege