特征选择与稀疏学习

本文探讨了特征选择的原因,如避免维数灾难和降低学习难度,并详细介绍了过滤式、包裹式和嵌入式三种特征选择方法。重点讨论了L1正则化(LASSO回归)和L2正则化(岭回归)如何实现稀疏学习。
摘要由CSDN通过智能技术生成

一、特征选择原因

  1. 避免维数灾难
  2. 去除不相关特征可以降低学习难度

二、特征选择方法

常见的特征选择方法主要有三种:过滤式(Filter)、包裹式(Wrapper)、嵌入式(Embedding)

1. 过滤式选择

先对特征进行选择,然后再训练学习器,这里介绍一个著名的过滤式选择方法:Relief
训练集 { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x m , y m ) } \{(x_1,y_1),(x_2,y_2),...,(x_m,y_m)\} { (x1,y1),(x2,y2),...,(xm,ym)},对每个 x i x_i xi,在 x i x_i xi的同类样本中找到最近的样本 x i , n h x_{i,nh} xi,nh,称为猜中近邻(near-hit),在 x i x_i xi的异类样本中找到最近的样本 x i , n m x_{i,nm} xi,nm,称为猜错近邻(near-miss)。属性j的相关统计量大小根据如下公式计算:
∑ i = 1 m − d i f f ( x i j , x i , n h j ) 2 + d i f f ( x i j , x i , n m

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值