svm_分类_linearSVC线性分类支持向量机——鸢尾花（一名大学生的机器学习之路）

WJWFighting

已于 2022-05-24 12:08:06 修改

阅读量1.8w

点赞数 1

分类专栏：机器学习文章标签：机器学习支持向量机分类

于 2018-07-09 16:04:12 首次发布

本文链接：https://blog.csdn.net/wjwfighting/article/details/80970396

版权

本文介绍了支持向量机（SVM）分类器中的线性分类，特别是聚焦于Hinge损失函数的作用以及罚项形式（如L1和L2正则化）和罚项系数C的影响。通过实例分析展示了如何在预测中选择最佳的分类边界，强调支持向量在模型中的关键角色。

摘要由CSDN通过智能技术生成

支持向量机分类器(Support Vector Classifier)是根据训练样本的分布，搜索所以可能的线性分类器中最佳的那个，
决定分类边界位置的样本并不是所有训练数据，是其中的两个类别空间的间隔最小的两个不同类别的数据点，即“支持向量”。
从而可以在海量甚至高维度的数据中，筛选对预测任务最为有效的少数训练样本。

（LogisticRegression模型在训练过程中考虑了所有训练样本对参数的影响）

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets,linear_model,cross_validation,svm
%matplotlib inline
iris=datasets.load_iris()

iris=datasets.load_iris()
X_train = iris.data #data 表示数据
y_train = iris.target

这里采用分层采样
stratify:array-like或者None,默认是None.如果不是None，将会利用数据的标签将数据分层划分
若为None时，划分出来的测试集或训练集中，其类标签的比例也是随机的
若不为None时，划分出来的测试集或训练集中，其标签的比例同输入的数组中类标签的比例相同，可以用于处理不均衡的数据集

X_train,X_test,y_train,y_test=cross_validation.train_test_split(X_train,y_train,test_size=0.25,random_state=0,stratify=y_train)
print(X_train[0:1])
print(y_train[0:1])

测试结果为：

[[ 5.   2.   3.5  1. ]]
[1]

cls=svm.LinearSVC()
cls.fit(X_train,y_train)
print('各特征权重：%s,截距:%s'%(cls.coef_,cls.intercept_))
print("算法评分：%.2f" % cls.score(X_test,y_test))

运行结果：

各特征权重：[[ 0.20959286  0.39923917 -0.8173906  -0.44231852]
 [-0.1283436

最低0.47元/天解锁文章

WJWFighting

关注

1
点赞
踩
43

收藏

觉得还不错? 一键收藏
打赏
2
评论
svm_分类_linearSVC线性分类支持向量机——鸢尾花（一名大学生的机器学习之路）

支持向量机分类器(Support Vector Classifier)是根据训练样本的分布，搜索所以可能的线性分类器中最佳的那个，决定分类边界位置的样本并不是所有训练数据，是其中的两个类别空间的间隔最小的两个不同类别的数据点，即“支持向量”。从而可以在海量甚至高维度的数据中，筛选对预测任务最为有效的少数训练样本。（LogisticRegression模型在训练过程中考虑了所有训练样本对参数的影响）...
复制链接

扫一扫