SVM和Logistic回归之间的区别

SVM和Logistic回归之间的区别
SVM试图找到分隔类别的“最佳”边距(线与支撑向量之间的距离),这降低了数据出错的风险,而逻辑回归则没有,相反,它可以具有不同的权重而具有不同的决策边界 即使在最佳点附近。

SVM可以很好地处理非结构化和半结构化数据(例如文本和图像),而逻辑回归可以使用已经确定的自变量。
SVM基于数据的几何特性,而逻辑回归基于统计方法。
在SVM中,过度拟合的风险较小,而Logistic回归很容易过度拟合。

何时使用Logistic回归与支持向量机
根据您拥有的训练集(数据)/功能的数量,您可以选择使用逻辑回归或支持向量机。
让我们以这些为例:
n =功能数量,
m =训练示例数
1.如果n大(1–10,000),而m小(10–1000):请使用逻辑回归或线性核的SVM。
2.如果n小(1–10 00)并且m在中间(10–10,000):将SVM与(高斯,多项式等)内核一起使用
3.如果n小(1–10 00),m大(50,000–1,000,000 +):首先,手动添加更多特征,然后逻辑回归或SVM加上线性核
通常,通常建议首先尝试使用逻辑回归来查看模型的工作方式,如果模型失败,则可以尝试使用没有内核的SVM(否则称为带有线性内核的SVM)。 Logistic回归和具有线性核的SVM具有相似的性能,但是取决于您的功能,一个可能比另一个更有效。

其次
LR给出了校准概率,可以将其解释为决策的置信度。
LR为我们提供了一个不受限制的,平滑的目标。
可以在贝叶斯模型中直接使用LR。
SVM具有很好的双重形式,使用内核技巧时可提供稀疏的解决方案(更好的可伸缩性)

Logistic回归假设预测变量不足以确定响应变量,而是确定概率作为它们线性组合的逻辑函数。如果噪音很大,逻辑回归是一项很棒的技术。

另一方面,存在一些问题,其中您有成千上万的维度,而预测变量几乎可以肯定地确定响应,但是以某种难以解释的编程方式进行。一个例子是图像识别。如果您有100 x 100像素的灰度图像,则已经有10,000个尺寸。通过各种基础转换(内核技巧),您将能够获得数据的线性分隔符。

当存在一个分离的超平面时,非正则逻辑回归技术不能很好地工作(实际上,拟合系数会发散),因为通过任何分离的平面都可以获得最大的可能性,并且不能保证会得到最好的。您得到的是一个非常有信心的模型,在边际附近的预测能力很差。

SVM为您提供最佳的分离超平面,它们在高维空间中效率很高。它们与正则化在试图找到将数据分开的最低范数矢量方面相似,但其边距条件有利于选择良好的超平面。硬边界的SVM将找到一个将所有数据分隔开的超平面(如果存在),如果没有则失败。当数据中存在噪声时,软边距SVM(通常首选)效果更好。

此外,SVM仅考虑边缘附近的点(支持向量)。 Logistic回归考虑了数据集中的所有点。

逻辑回归在较小的维度上非常有用,并且当预测变量不足以给出响应的概率估计时。当维数较大时,SVM的效果更好,尤其是在预测变量确实(或几乎确定)确定响应的问题上。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,你想了解这些分类算法在预测乳腺癌数据集方面的性能和差异吗?如果是的话,我可以为你提供一些简要的信息。 首先,决策树是一种基于树状结构的分类算法,它将数据集分成一系列的子集,直到每个子集都只包含一个类别。决策树易于理解和解释,但可能会出现过拟合的问题。 其次,KNN(K-最近邻)算法是一种基于实例的学习方法,它通过在训练集中查找最近的K个邻居来预测新的数据点的分类。KNN算法简单易用,但可能会受到训练集中噪声的影响。 朴素贝叶斯算法是一种基于概率的分类算法,它将数据集分成不同的类别,并通过计算条件概率来推断新的数据点的分类。朴素贝叶斯算法具有计算效率高和大规模数据集上表现良好的特点。 SVM(支持向量机)算法是一种基于最大间隔的分类方法,它通过将数据点映射到高维空间中,找到一个能够最大化分类间隔的超平面来预测新的数据点的分类。SVM算法的泛化能力强,但可能会受到数据集中异常值的影响。 最后,Logistic回归是一种基于概率的分类算法,它使用sigmoid函数来将输入特征映射到0和1之间,并通过最大化似然函数来拟合数据集。Logistic回归算法易于理解和实现,但可能会受到训练集中噪声的影响。 这些算法都可以用于预测乳腺癌数据集中患者的分类,但它们在性能和差异方面可能会有所不同。具体来说,你可以通过交叉验证和模型评估指标(如精度、召回率、F1分数等)来比较这些算法的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值