10、LR和SVM的联系与区别

LR和SVM都可以处理分类问题,且一般都用于处理线性二分类问题(在改进的情况下可以处理多分类问题)

区别:
1、LR是参数模型,svm是非参数模型,linear和rbf则是针对数据线性可分和不可分的区别;
2、从目标函数来看,区别在于逻辑回归采用的是logistical loss,SVM采用的是hinge loss,这两个损失函数的目的都是增加对分类影响较大的数据点的权重,减少与分类关系较小的数据点的权重。 

3、SVM的处理方法是只考虑support vectors,也就是和分类最相关的少数点,去学习分类器。而逻辑回归通过非线性映射,大大减小了离分类平面较远的点的权重,相对提升了与分类最相关的数据点的权重。
4、逻辑回归相对来说模型更简单,好理解,特别是大规模线性分类时比较方便。而SVM的理解和优化相对来说复杂一些,SVM转化为对偶问题后,分类只需要计算与少数几个支持向量的距离,这个在进行复杂核函数计算时优势很明显,能够大大简化模型和计算。 

5、logic 能做的 svm能做,但可能在准确率上有问题,svm能做的logic有的做不了。

 

相同点
①都是线性分类器。本质上都是求一个最佳分类超平面。
②都是监督学习算法。
③都是判别模型。判别模型不关心数据是怎么生成的,它只关心信号之间的差别,然后用差别来简单对给定的一个信号进行分类。常见的判别模型有:KNN、SVM、LR,常见的生成模型有:朴素贝叶斯,隐马尔可夫模型。

 

不同点
1) 本质上是损失函数不同
LR的损失函数是交叉熵: 

SVM的目标函数: 

逻辑回归基于概率理论,假设样本为正样本的概率可以用sigmoid函数(S型函数)来表示,然后通过极大似然估计的方法估计出参数的值。
支持向量机基于几何间隔最大化原理,认为存在最大几何间隔的分类面为最优分类面。

2) 两个模型对数据和参数的敏感程度不同
SVM考虑分类边界线附近的样本(决定分类超平面的样本)。在支持向量外添加或减少任何样本点对分类决策面没有任何影响;
LR受所有数据点的影响。直接依赖数据分布,每个样本点都会影响决策面的结果。如果训练数据不同类别严重不平衡,则一般需要先对数据做平衡处理,让不同类别的样本尽量平衡。

3) SVM 基于距离分类,LR 基于概率分类。
SVM依赖数据表达的距离测度,所以需要对数据先做 normalization;LR不受其影响。

4) 在解决非线性问题时,支持向量机采用核函数的机制,而LR通常不采用核函数的方法。
SVM算法里,只有少数几个代表支持向量的样本参与分类决策计算,也就是只有少数几个样本需要参与核函数的计算。
LR算法里,每个样本点都必须参与分类决策的计算过程,也就是说,假设我们在LR里也运用核函数的原理,那么每个样本点都必须参与核计算,这带来的计算复杂度是相当高的。尤其是数据量很大时,我们无法承受。所以,在具体应用时,LR很少运用核函数机制。

5) 在小规模数据集上,Linear SVM要略好于LR,但差别也不是特别大,而且Linear SVM的计算复杂度受数据量限制,对海量数据LR使用更加广泛。

6) SVM的损失函数就自带正则,而 LR 必须另外在损失函数之外添加正则项。 

红框内就是L2正则。

LR逻辑回归)和SVM(支持向量机)都是常见的机器学习算法,可以用于特征建模和分类任务。在使用LRSVM对特征进行建模并采用五折验证法时,可以按照以下步骤进行: 1. 特征提取:根据问题的需求,从原始数据中提取出适合建模的特征。这可以包括数值特征、文本特征、图像特征等。 2. 特征预处理:对提取出的特征进行预处理,包括缺失值处理、标准化、归一化等。确保特征在相同的尺度上。 3. 数据划分:将数据集划分为训练集和测试集。通常采用五折交叉验证,将数据集分成五个子集,每次使用四个子集作为训练集,剩余的一个子集作为测试集。 4. 特征建模:对每个训练集进行LRSVM模型的训练。LR是一种广义线性模型,可以用于二分类或多分类任务;SVM是一种非线性分类器,可以通过选择不同的核函数进行分类。 5. 模型评估:使用训练好的模型对测试集进行预测,并计算预测结果与真实标签之间的准确率、精确率、召回率、F1值等指标。 6. 重复步骤4和步骤5,直到每个子集都作为测试集进行了一次。最后,将各次模型评估的指标求平均值,得到最终的模型性能评估结果。 通过以上步骤,可以使用LRSVM对特征进行建模,并采用五折验证法来评估模型的性能。这样可以减小模型对特定数据集的过拟合情况,并提供对模型性能的更准确评估。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值