七月机器学习之特征工程6

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

随机取样:可能无法表征所有的情况
分层采样:对不同的年龄段(举例)进行采样

大多数算法对正负样本都是很敏感的
下采样:比如正样本很多,我们在正样本中抽取数据,使得正负样本一样多
如果正样本比负样本大很多,建议你取采集更多的数据

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述
selectKBest选择与y相关度最高的k个数据
这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

l1正则化是截断,也就是说不相关的就截断,权重为0,selectfrommodel可以选出大于权重0的特征
这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值