利用支持向量机分析乳腺癌数据集

该博客介绍了如何使用支持向量机(SVM)和感知机算法对乳腺癌数据集进行分类。实验要求包括计算分类准确率、精确率、召回率、F1-score并绘制ROC曲线,同时通过5折交叉验证评估模型性能。通过对两种算法的对比,分析它们在实际问题中的效果差异。
摘要由CSDN通过智能技术生成

实验要求

数据中已经分好了训练集和测试集,是二分类问题(阴性和阳性),使用支持向量机建模对数据进行分类。
具体要求:
(1) 得出相应的分类指标准确率accuracy,精确率precision,召回率recall,F1-score,并画出最终的ROC曲线,得出AUC值。
(2) 对比感知机算法也进行训练和测试,比较两个算法的结果。
(3) 运用5-fold Cross-validation方法进行验证。

数据展示

在这里插入图片描述

代码

导包
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import svm
from sklearn.linear_model import Perceptron
from sklearn.metrics import precision_score, recall_score, f1_score, roc_auc_score, roc_curve
from sklearn.model_selection import cross_val_score, cross_val_predict
加载数据
# 加载数据
train = pd.read_csv(r"C:\Users\guo\Desktop\课程\医学数据挖掘\实验3-支持向量机分析乳腺癌数据实验\breast-cancer-train.csv").iloc[:, 1:]
test = pd.read_csv(r"C:\Users\guo\Desktop\课程\医学数据挖掘\实验3-支持向量机分析乳腺癌数据实验\breast-cancer-test.csv").iloc[:, 1:]

x_train, y_train = train.iloc[:, :-1], train.iloc[:, -1]
x_test, y_test = test.iloc[:, :-1], test.iloc[:, -1]
SVM
# 用线性核函数建立支持向量机模型
model = svm.SVC(kernel=
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Re:从零开始的代码生活

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值