数据集:链接: https://pan.baidu.com/s/1V_O9fW8jUTwtpgeVb7cSmg 提取码: 7sjx
目录
一、支持向量机(SVC)实现乳腺癌肿瘤预测
Scikit-learn(以前称为scikits.learn,也称为sklearn)是针对Python 编程语言的免费软件机器学习库。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值和DBSCAN,并且旨在与Python数值科学库NumPy和SciPy联合使用。
本项目将使用支持向量机对乳腺癌肿瘤数据进行预测,实现二分类任务。
二、数据集介绍
scikit-learn内置的乳腺癌数据集来自加州大学欧文分校机器学习仓库中的威斯康辛州乳腺癌数据集。
乳腺癌数据集是一个共有569个样本、30个输入变量和2个分类的数据集。
30个数值型测量结果由数字化细胞核的10个不同特征的均值、标准差和最差值(即最大值)构成。这些特征包括:
- radius(半径):mean of distances from center to points on the perimeter
- texture(质地)