fisher线性判别算法python_数据特征筛选——核岭回归及相关算法对比

(本文系原创,如需转载请注明出处)

筛选数据特征不知道该用什么算法?让我们来对几个常见的经典算法做比较,给大家加深一点辩证的理解吧。

从应用的角度来说,数据特征如果明显线性不可分,核映射到高维空间,在高维空间可以转化成线性可分,有利于进行下一步工作,这是核映射的基本功能,这样的情况下是否倾向于选择核映射算法?以下是一些简单的推导和探讨。

1.核岭回归的基本原理、数学步骤、相似回归算法比较

1.1普通最小二乘法与岭回归

  1. 1.     最小二乘回归模型中,假设输入变量为5a1c06226191aeb116b887fef3912fbd.png,输出变量为4c1fddaae4a7c7b08f97141f48097e80.png,假设偏置项已包含在参数5247a847b1fc0d5dd738d8b39ad25ff8.png中,则线性回归的模型可表示为:                             edb5de5b8bd407cc66ca86294eadba96.png 60e4e6e064718057811c72f2fc4bbcbd.png

    那么在最小二乘方法中,回归参数90d1585061ea9d5412a4e1a4143d0205.png的估计公式为

c68395d78f69b023a1eeb9b16d13a23e.png9e65bbdaa26e62bc11ebaff6e246b033.png

但是当1a7250e002f6dc16e7a72e18b77484b9.png不可逆时,则无法求出参数5247a847b1fc0d5dd738d8b39ad25ff8.png,同时如果af1cd0437e908793dc235d275af2f9e0.png趋近于0,会使回归系数趋于无穷大,此时得到的回归系数是没有意义的。而岭回归可以解决此类问题。最小二乘回归模型中的目标函数为:

9a7d9a6b97f989ee0792e245a324c8e9.pngd1fed8be4b5bef10fcbc5800d18ed6db.png

为了解决上述问题,岭回归模型在目标函数上加上L2范数的惩罚项,即:

55781783c8bd251cde7fd4185caebc62.png33480ddff1d56f6157b634d43f2f0c7a.png

其中2faea1698c0acf92ecdd8f9fd4f10cd2.png为非负数,进一步式(4)可化为:

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值