[读书笔记]机器学习-11章-特征选择和稀疏学习

11 特征选择和稀疏学习

11.1 子集搜索和评价

定义:特征很多,选出相关的特征的过程
原因:
- 维度灾难(和10章讲的降维有关系)
- 降低学习难度

问题的难点:组合爆炸.
解决的两个环节:

如何评价子集好坏

一个特征划分样本和正本真实划分约接近,特征效果越好.
书中的例子是使用信息熵增益

gain(A)=Ent(D)|Di||D|Ent(Di)

如何根据现在的评价结果选择下一个子集

前向/后向 都是贪心的,可能不一定是最优的

这和决策树很像,facebook的gbdt+lr就是这么搞的吧.还有很多不明显的.

11.2 过滤式选择

11.3 包裹式学习

11.4 嵌入式选择与 L1 正则化

11.5 稀疏表示与字典学习

11.6 压缩感知

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值