利用支持向量机分析乳腺癌数据集

最新推荐文章于 2024-06-27 19:13:37 发布

Re:从零开始的代码生活

最新推荐文章于 2024-06-27 19:13:37 发布

阅读量1.3k

点赞数 2

分类专栏：数据挖掘与机器学习文章标签：支持向量机 python 交叉验证感知机

本文链接：https://blog.csdn.net/fjdep/article/details/127913285

版权

该博客介绍了如何使用支持向量机（SVM）和感知机算法对乳腺癌数据集进行分类。实验要求包括计算分类准确率、精确率、召回率、F1-score并绘制ROC曲线，同时通过5折交叉验证评估模型性能。通过对两种算法的对比，分析它们在实际问题中的效果差异。

摘要由CSDN通过智能技术生成

实验要求

数据中已经分好了训练集和测试集，是二分类问题（阴性和阳性），使用支持向量机建模对数据进行分类。
具体要求：
（1）得出相应的分类指标准确率accuracy，精确率precision，召回率recall，F1-score，并画出最终的ROC曲线，得出AUC值。
（2）对比感知机算法也进行训练和测试，比较两个算法的结果。
（3）运用5-fold Cross-validation方法进行验证。

数据展示

在这里插入图片描述

代码

导包

import pandas as pd
import matplotlib.pyplot as plt
from sklearn import svm
from sklearn.linear_model import Perceptron
from sklearn.metrics import precision_score, recall_score, f1_score, roc_auc_score, roc_curve
from sklearn.model_selection import cross_val_score, cross_val_predict

加载数据

# 加载数据
train = pd.read_csv(r"C:\Users\guo\Desktop\课程\医学数据挖掘\实验3-支持向量机分析乳腺癌数据实验\breast-cancer-train.csv").iloc[:, 1:]
test = pd.read_csv(r"C:\Users\guo\Desktop\课程\医学数据挖掘\实验3-支持向量机分析乳腺癌数据实验\breast-cancer-test.csv").iloc[:, 1:]

x_train, y_train = train.iloc[:, :-1], train.iloc[:, -1]
x_test, y_test = test.iloc[:, :-1], test.iloc[:, -1]

SVM

# 用线性核函数建立支持向量机模型
model = svm.SVC(kernel=

最低0.47元/天解锁文章

Re:从零开始的代码生活

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录