feature select

特征选择的主要作用是:降维,减少特征数量,防止过拟合,增强模型的泛化能力。

1、变异系数(标准差/均值)

import numpy as np
np.std(x)/np.mean(x)

2、皮尔逊相关系数(线性相关)

from scipy.stats import pearsonr
pearsonr(x, y)

3、互信息

from minepy import MINE
m = MINE()
m.compute_score(x, y)
print(m.mic())

4、线性拟合系数

5、L1(Lasso)或者L2(Ridge)正则化

6、树模型

7、交叉验证

8、卡方检验

from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
model1 = SelectKBest(chi2, k=2)#卡方检验
model1.fit_transform(x, y)
score = zip(feature_columns, model1.scores_)#置信度越高越好
value = zip(feature_columns, model1.pvalues_)#p值越小越好
score = sorted(score, key=lambda x: x[1], reverse=True)
value = sorted(value, key=lambda x: x[1], reverse=False)
print '置信度:', score
print 'p值:', value



  

转载于:https://www.cnblogs.com/kayy/p/8647358.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值