支持向量机SVM学习过程中的数学问题及笔记:正则化,范数和KKT条件

本文详细介绍了支持向量机SVM中的正则化,解释了正则化如何避免过拟合,通过引入结构风险最小化。接着讨论了不同类型的范数,如L1和L2范数,并阐述了它们在模型简化和参数稀疏化中的作用。此外,还解释了L1和L2正则化如何对应于不同的先验知识,并分析了L1正则化导致的稀疏性以及L2正则化对权重的影响。最后,提到了KKT条件在优化问题中的应用。
摘要由CSDN通过智能技术生成

1、正则化
正则化是一种回归的形式,它将系数估计(coefficient estimate)朝零的方向进行约束、调整或缩小。也就是说,**正则化可以在学习过程中降低模型复杂度和不稳定程度,从而避免过拟合的危险。**正则化就是对最小化经验误差函数上加约束,这样的约束可以解释为先验知识。约束有引导作用,在优化误差函数的时候倾向于选择满足约束的梯度减少的方向,使最终的解倾向于符合先验知识。
正则化问题更具体的数学表达如下:
在这里插入图片描述
其中Ω(f)称为“结构风险”,用于描述模型f的某些性质;第二项称为“经验风险”,用于描述模型与训练数据的契合程度;C用于折中二者。从经验风险最小化的角度来看,Ω(f)表述了“我们希望获得具有何种性质的模型”,另一方面,该信息有助于削减假设空间,降低过拟合风险。从正则化的角度来看,Ω(f)称为正则化项,C称为正则化常数,Lp范数是常用的正则化项。

2、范数
范数是一种强化了的距离概念,常常被用来度量某个向量空间(或矩阵)中的每个向量的长度或大小。有时候为了便于理解,我们可以把范数当作距离来理解。在数学上,范数包括向量范数和矩阵范数,向量范数表征向量空间中向量的大小,矩阵范数表征矩阵引起变化的大小。
几种常用的范数如下:
(1)LP范数
LP范数不是一个范数,而是一组范数,其定义如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值