数据集概况
Breast Cancer Wisconsin (Diagnostic) Data Set【威斯康辛 乳腺癌 数据集】的地址为:https://archive.ics.uci.edu/ml/datasets/Breast+cancer+Wisconsin+(Diagnostic)
该页面中,可以进入Data Set Description 来查看数据的说明文档,另外一个是Data Folder 查看数据集的下载地址。
数据集共569条数据,32列,其中有30个特征剩余二个是Id和Diagnostic,主要针对的是细胞核特征,是连续型特征,每个样本的标签是诊断的结果良心、恶性,共有357个良性,212个恶性。预估的特征重要性排序:面积平均值>周长平均值=半径平均值>凹度平均值>凹点平均值。