python 分类任务特征筛选1

最新推荐文章于 2023-04-27 16:15:28 发布

wei_liao

最新推荐文章于 2023-04-27 16:15:28 发布

阅读量730

点赞数

分类专栏： python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41358871/article/details/100046469

版权

python 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

#检验一个变量，如果取较多数值的（>=90%）,如果较多类和较小类的label分布差异不明显，删除该变量
def Remove_not_obvious(df,col,var_list,label='label'):
    '''df：数据样本'''
    '''col:检测变量'''
    '''label:标签'''
    '''vae_list:变量列表'''
    df_des=pd.DataFrame(df[col].value_counts()).reset_index().rename(columns={'index':'value',col:'value_num'})
    df_des['value_prob']=df_des['value_num']/len(df)
    if df_des['value_prob'][0]>.9:
        var_90_ratio=df.loc[df[col]==df_des['value'][0],label].mean()
        var_10_ratio=df.loc[df[col]!=df_des['value'][0],label].mean()
        if 0.8*var_10_ratio<=var_90_ratio <1.2*var_10_ratio:
            return True

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python 分类任务特征筛选1

#检验一个变量，如果取较多数值的（>=90%）,如果较多类和较小类的label分布差异不明显，删除该变量def Remove_not_obvious(df,col,var_list,label='label'): '''df：数据样本''' '''col:检测变量''' '''label:标签''' '''vae_list:变量列表''' df_d...
复制链接

扫一扫

专栏目录

wei_liao CSDN认证博客专家 CSDN认证企业博客

码龄7年

42: 原创

3万+: 周排名

49万+: 总排名

19万+: 访问

: 等级

1769: 积分

819: 粉丝

117: 获赞

17: 评论

636: 收藏

私信

关注

热门文章

分类专栏

最新评论

xgboost
windawdaysss: 分号前面的是一种情况，后面是另一种情况
数据预处理
momo儿: 膜拜技术大佬,来我博客指点江山吧
xgboost
1015号居民: Entropy(S)=0； S的正反样例数量相等。请教一下博主，这儿S是不是只有正样例（或者只有反样例），Entropy(S)=0
python 特征筛选
517不敲代码: dalao,我有一个问题想请教您，第九行检验卡方的这条命令我一直运行错误，寻找无果。[code=python] ValueError Traceback (most recent call last) <ipython-input-12-d11f20caa53b> in <module> ----> 1 (chi2,pval) = chi2(X_category,y) D:\anaconda\lib\site-packages\sklearn\feature_selection\_univariate_selection.py in chi2(X, y) 213 # XXX: we might want to do some of the following in logspace instead for 214 # numerical stability. --> 215 X = check_array(X, accept_sparse='csr') 216 if np.any((X.data if issparse(X) else X) < 0): 217 raise ValueError("Input X must be non-negative.") D:\anaconda\lib\site-packages\sklearn\utils\validation.py in inner_f(*args, **kwargs) 70 FutureWarning) 71 kwargs.update({k: arg for k, arg in zip(sig.parameters, args)}) ---> 72 return f(**kwargs) 73 return inner_f 74 D:\anaconda\lib\site-packages\sklearn\utils\validation.py in check_a [/code]

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。