Linear SVM和LR的区别和联系

最新推荐文章于 2023-11-10 09:13:43 发布

weixin_34204722

最新推荐文章于 2023-11-10 09:13:43 发布

阅读量127

点赞数

文章标签：数据结构与算法

首先，SVM和LR(Logistic Regression)都是分类算法。SVM通常有4个核函数，其中一个是线性核，当使用线性核时，SVM就是Linear SVM，其实就是一个线性分类器，而LR也是一个线性分类器，这是两者的共同之处。

不同之处在于，第一，LR只要求计算出一个决策面，把样本点分为两类就行了，不要求分得有多好；而Linear SVM要求决策面距离两个类的点的距离要最大。

第二，Linear SVM只考虑边界线附近的点，而LR要考虑整个样本所有的点，如果增加一些样本点，只要这些样本点不在Linear SVM的边界线附近（即在支持向量外），Linear SVM的决策面是不会变的，而LR的决策面是会发生变化的，即LR中每个样本点都会对决策面产生影响。

第三，由于指导思想的不同，两者的Loss function是不同的。

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34204722

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

算法理论——Linear SVM

H114754726的博客

07-02

294

问题引入下面的三个超平面都起到分类的效果，哪个最好？答案显然是第三个。为什么？直觉上，如果现在我们有个测试点，非常靠近右下角的那个红叉叉，也就是说这个点的特征与那个红叉叉非常接近，这时候，我们希望我们的分类器能够将这个测试点划分为与红叉叉相同的类。也就是说，我们希望，找到的超平面能够远离所有的点，也就是要最小化超平面到离它最近的那个点的距离。于是，用...

线性分类模型的区别(SVM,LR)

qq_16236875的博客

04-15

2386

1 SVM和LR的区别 1.1模型解决问题的方式 LinearSVM直观上是trade-off两个量，一个是largemargin ：两类之间可以画多宽的gap，L1错误惩罚：是对所有不满足上述条件的点做L1惩罚。给定一个数据集，一旦完成LinearSVM的求解，所有数据点可以被归成2类：一个是落在对应分界平面外并被正确分类的点，一类是落在gap里被错误分类的点。...

参与评论您还未登录，请先登录后发表或查看评论

SVM有监督学习LinearSVC, LinearSVR,SVC,SVR -- 024

小麦粒的Python

03-21

1万+

支持向量机

zy702432103的博客

10-28

1343

支持向量机一、最大间隔 1.margin的含义为决定分类面可以平移的范围。 2.线性SVM和一般分类器的主要区别是：线性SVM能够确保间隔最大化。 3.margin越大，测试的容错率越高。 4.支持向量指的是决定分类面可以平移的范围的数据点。二、线性SVM 1.SVM中用到的乘法为向量内积。 2.soft margin的主要用途是解决不完全线性可分问题。三、数学家的把戏 1.线性不可分支持向量机Non-linear SVM在SVM当中进行空间映射的主要目的：提高原始问题的可分性。 2.对于SVM

Python实现WOA智能鲸鱼优化算法优化支持向量机回归模型(LinearSVR算法)项目实战

张陈亚的博客

10-19

3259

Python实现WOA智能鲸鱼优化算法优化支持向量机回归模型(LinearSVR算法)项目实战

【机器学习】Linear SVM 和 LR 的联系和区别

haolexiao的专栏

04-16

1万+

今天看到别人问这个问题，突然想到自己也对这两个经典的线性分类器没有太过区别其异同，所以特此翻阅了一下资料总结了一番。以下理论部分主要参考了LR与SVM的异同这篇文章 LR和Linear SVM的相同点都是监督的分类算法都是线性分类方法另外这里需要说的就是LR也是可以加核函数的至于为什么不用，是原因的，后面再说。都是判别模型判别模型和生成模型是两个相对应的模型。判别模型是直接生成一个

机器学习 - - - LR和SVM的联系与区别？

julyedu_7的博客

12-09

2323

解析一 LR和SVM都可以处理分类问题，且一般都用于处理线性二分类问题（在改进的情况下可以处理多分类问题）区别： 1、LR是参数模型，svm是非参数模型，linear和rbf则是针对数据线性可分和不可分的区别； 2、从目标函数来看，区别在于逻辑回归采用的是logistical loss，SVM采用的是hinge loss，这两个损失函数的目的都是增加对分类影响较大的数据点的权重，减少与分类关系较小的数据点的权重。 3、SVM的处理方法是只考虑support vectors，也就是和分类最相关的少

Linear SVM 和 LR 有什么异同以及分别在什么情况下使用？

lemonaha的博客

02-16

2659

Linear SVM和LR都是线性分类器 Linear SVM不直接依赖数据分布，分类平面不受一类点影响；LR则受所有数据点的影响，如果数据不同类别strongly unbalance一般需要先对数据做balancing Linear SVM依赖数据表达的距离测度，所以需要对数据先做normalization；LR不受其影响 Linear SVM依赖penalty的系数，实验中需要做validati

面试（1）：逻辑回归（LR）与支持向量机（SVM）的区别和联系

小蜗牛的博客

06-23

5212

逻辑回归（LR）与支持向量机（SVM）的区别和联系1、为什么常比较这两个算法2、二者相同点3、二者不同点 1、为什么常比较这两个算法（1）这两个算法是基础算法，常被使用。（2）LR与SVM之间有很多相似点，因此常被放在一起比较。 2、二者相同点第一，LR和SVM都是分类算法。 LR和S...

谈谈linear regression 和 SVM

baidu_36316735的博客

02-27

4854

线性分类是一个简单而又非常实用的概念。因为其速度快，在工业界中广泛应用。 SVM一般是学习机器学习接触的又一个学习方法，非常fasion，学术界研究大热，数学上有严格的证明。但是由于神经网络的优异表现，风头渐渐不如以前。这里就一个知识点进行自己小小总结。线性回归和SVM有什么区别呢。网上很多人直接拿出这张图给你。例如知乎上这个答案 https://www.zhihu.com/qu

SVR.jl:无监督机器学习的支持向量回归

03-20

SVR 使用库在中支持向量回归（SVR）分析。 SVR是（模型分析和决策支持）的模块。安装 import Pkg; Pkg . add ( " SVR " ) 例子匹配正弦函数： import SVR import Mads X = sort ( rand ( 40 ) * 5 ) y = sin .(X) 预测y基于X使用RBF Mads.plotseries([y SVR.fit(y, permutedims(X); kernel_type=SVR.RBF)], "figures/rbf.png"; title="RBF", names=["Truth", "Prediction"]) 预测y基于X使用LINEAR Mads.plotseries([y SVR.fit(y, permutedims(X); kernel_type=SVR.LINEAR)], "figure

【Python机器学习】零基础掌握LinearSVR支持向量机

最新发布

Mr数据杨

11-10

213

在本次的内容中，探讨了支持向量机中的一个特定版本——LinearSVR。通过结合理论知识与实际应用案例，揭示了LinearSVR在预测太阳能发电效率方面的应用潜力。具体来说，介绍了算法的基本原理，如何通过sklearn库实现建模，并通过一个模拟数据集来演示其在实际问题中的应用。通过可视化的方式，展示了模型预测结果与实际数据的对比，使得算法的效果一目了然。优点总结，LinearSVR算法在数据拟合方面效果显著，尤其适用于大规模线性问题。

【支持向量机SVM系列教程3】支持向量回归SVR

qq_42554780的博客

09-30

6695

3 支持向量回归SVR 使用支持向量机算法不仅能解决分类问题，还能解决回归问题。 3.1 解决的目标支持向量回归所要解决的问题是：对于给定如下的的训练数据集， D={(x1,y1),(x2,y2) ...,(xm,ym)},yi∈R D=\{(\boldsymbol x_1,y_1),(\boldsymbol x_2,y_2) \,...,(\boldsymbol x_m,y_m)\},y_i \in \mathbb{R} D={(x1,y1),(x2,y2)...,(xm,ym)},yi∈

3.线性分类器与非线性分类器的区别与优劣？

花小七

12-18

4814

首先线性和非线性是针对模型参数和输入特征来讲的：比如输入x，模型y=ax+ax^2那么就是非线性模型，如果输入是x和X^2则模型是线性的。再看定义考虑二类的情形，所谓线性分类器即用一个超平面将正负样本分离开，表达式为 y=wx 。这里是强调的是平面。而非线性的分类界面没有这个限制，可以是曲面，多个超平面的组合等。【如果模型是参数的线性函数，并且存在线性分类面，那么就是线性分类器，否则...

SVM学习（二）：线性分类器

Liam Q的专栏

10-25

1万+

1.线性分类器概念线性分类器(一定意义上,也可以叫做感知机) 是最简单也很有效的分类器形式.在一个线性分类器中,可以看到SVM形成的思路,并接触很多SVM的核心概念。用一个二维空间里仅有两类样本的分类问题来举个小例子。如图所示： C1和C2是要区分的两个类别，在二维平面中它们的样本如上图所示。中间的直线就是一个分类函数，它可以将两类样本完全分开

感知器、logistic与svm 区别与联系

m0_37786651的博客

03-12

9386

从感知器谈起对于典型的二分类问题，线性分类器的目的就是找一个超平面把正负两类分开。对于这个超平面，我们可以用下面的式子来表示， ωTx+b=0ω^Tx+b=0 感知器是最简单的一种线性分类器。用f(x)表示分类函数，感知器可以如下来表示。 f(x)=sign(ωTx+b)f(x)=sign(ω^T x+b) 感知器相当于一个阶跃函数，如下图所示，在0处有一个突变。损失函数是分类器优化的目

深度学习笔记（一）线性SVM与SoftMax分类器

Yuriel媛的Blog

09-09

9275

1. 线性分类器KNN处理图像识别虽然实现起来非常简单，但是有很大的弊端：分类器必须记住全部的训练数据(因为要遍历找近邻啊！！)，而在任何实际的图像训练集上，数据量很可能非常大，那么一次性载入内存，不管是速度还是对硬件的要求，都是一个极大的挑战。分类的时候要遍历所有的训练图片，这是一个相当相当相当耗时的过程。这个部分我们介绍一类新的分类器方法，而对其的改进和启发也能帮助我们自然而然地过渡到深

浅谈线性多分类分类器（全连接层、SVM、Softmax classifier等）

热门推荐

Trasper1的博客

08-30

2万+

本文在CIFAR-10数据集上举例。CIFAR-10的训练集有50000张32*32*3的图片，包括10个类别。因此形成一个32*32*3 = 3072维的样本空间，此空间中其中包括50000个样本点。一个机器学习（包括深度学习）多分类器的生命周期包括3大模块： 1.Score Function：将3072维的input xi转化成一个10维的classfication score ve...

scikit-learn学习之SVM算法

weixin_33835690的博客

05-04

1111

====================================================================== 本系列博客主要参考 Scikit-Learn 官方网站上的每一个算法进行，并进行部分翻译，如有错误，请大家指正转载请注明出处，谢谢 ================================...

在SVM中，linear_svm.py、linear_classifier.py和svm.ipynb中相应的代码

05-25

linear_svm.py: ```python import numpy as np class LinearSVM: def __init__(self, lr=0.01, reg=0.01, num_iters=1000, batch_size=32): self.lr = lr self.reg = reg self.num_iters = num_iters self.batch_size = batch_size self.W = None self.b = None def train(self, X, y): num_train, dim = X.shape num_classes = np.max(y) + 1 if self.W is None: self.W = 0.001 * np.random.randn(dim, num_classes) self.b = np.zeros((1, num_classes)) loss_history = [] for i in range(self.num_iters): batch_idx = np.random.choice(num_train, self.batch_size) X_batch = X[batch_idx] y_batch = y[batch_idx] loss, grad_W, grad_b = self.loss(X_batch, y_batch) loss_history.append(loss) self.W -= self.lr * grad_W self.b -= self.lr * grad_b return loss_history def predict(self, X): scores = X.dot(self.W) + self.b y_pred = np.argmax(scores, axis=1) return y_pred def loss(self, X_batch, y_batch): num_train = X_batch.shape[0] scores = X_batch.dot(self.W) + self.b correct_scores = scores[range(num_train), y_batch] margins = np.maximum(0, scores - correct_scores[:, np.newaxis] + 1) margins[range(num_train), y_batch] = 0 loss = np.sum(margins) / num_train + 0.5 * self.reg * np.sum(self.W * self.W) num_pos = np.sum(margins > 0, axis=1) dscores = np.zeros_like(scores) dscores[margins > 0] = 1 dscores[range(num_train), y_batch] -= num_pos dscores /= num_train grad_W = np.dot(X_batch.T, dscores) + self.reg * self.W grad_b = np.sum(dscores, axis=0, keepdims=True) return loss, grad_W, grad_b ``` linear_classifier.py: ```python import numpy as np class LinearClassifier: def __init__(self, lr=0.01, reg=0.01, num_iters=1000, batch_size=32): self.lr = lr self.reg = reg self.num_iters = num_iters self.batch_size = batch_size self.W = None self.b = None def train(self, X, y): num_train, dim = X.shape num_classes = np.max(y) + 1 if self.W is None: self.W = 0.001 * np.random.randn(dim, num_classes) self.b = np.zeros((1, num_classes)) loss_history = [] for i in range(self.num_iters): batch_idx = np.random.choice(num_train, self.batch_size) X_batch = X[batch_idx] y_batch = y[batch_idx] loss, grad_W, grad_b = self.loss(X_batch, y_batch) loss_history.append(loss) self.W -= self.lr * grad_W self.b -= self.lr * grad_b return loss_history def predict(self, X): scores = X.dot(self.W) + self.b y_pred = np.argmax(scores, axis=1) return y_pred def loss(self, X_batch, y_batch): num_train = X_batch.shape[0] scores = X_batch.dot(self.W) + self.b correct_scores = scores[range(num_train), y_batch] margins = np.maximum(0, scores - correct_scores[:, np.newaxis] + 1) margins[range(num_train), y_batch] = 0 loss = np.sum(margins) / num_train + 0.5 * self.reg * np.sum(self.W * self.W) num_pos = np.sum(margins > 0, axis=1) dscores = np.zeros_like(scores) dscores[margins > 0] = 1 dscores[range(num_train), y_batch] -= num_pos dscores /= num_train grad_W = np.dot(X_batch.T, dscores) + self.reg * self.W grad_b = np.sum(dscores, axis=0, keepdims=True) return loss, grad_W, grad_b ``` svm.ipynb: ```python import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import make_blobs, make_moons from sklearn.model_selection import train_test_split from linear_classifier import LinearClassifier def plot_data(X, y, title): plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.RdBu) plt.title(title) plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.show() def plot_decision_boundary(clf, X, y, title): plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.RdBu) ax = plt.gca() xlim = ax.get_xlim() ylim = ax.get_ylim() xx = np.linspace(xlim[0], xlim[1], 100) yy = np.linspace(ylim[0], ylim[1], 100) XX, YY = np.meshgrid(xx, yy) xy = np.vstack([XX.ravel(), YY.ravel()]).T Z = clf.predict(xy).reshape(XX.shape) plt.contour(XX, YY, Z, levels=[0], colors='k', linestyles='-') plt.title(title) plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.show() def main(): X, y = make_blobs(n_samples=200, centers=2, random_state=42) plot_data(X, y, 'Linearly Separable Data') X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) clf = LinearClassifier() loss_history = clf.train(X_train, y_train) train_acc = np.mean(clf.predict(X_train) == y_train) test_acc = np.mean(clf.predict(X_test) == y_test) print('Train accuracy: {:.3f}, Test accuracy: {:.3f}'.format(train_acc, test_acc)) plot_decision_boundary(clf, X, y, 'Linear SVM') if __name__ == '__main__': main() ``` 以上的代码实现了一个简单的线性 SVM，可以用于二分类问题。在 `svm.ipynb` 文件中，我们使用 `make_blobs` 生成了一个线性可分的数据集，然后将其拆分为训练集和测试集。接着，我们使用 `LinearClassifier` 对训练集进行训练，并在测试集上评估模型性能。最后，我们绘制了模型的决策边界。