机器学习处理离散值方法之 95分位数盖帽法

最新推荐文章于 2024-05-02 07:30:39 发布

语亦情非

最新推荐文章于 2024-05-02 07:30:39 发布

阅读量5.2k

点赞数 1

分类专栏：机器学习实战文章标签： python

本文链接：https://blog.csdn.net/a1272899331/article/details/98451721

版权

机器学习实战专栏收录该内容

2 篇文章 0 订阅

订阅专栏

def train_add_hat(x,features):
    import numpy as np
    import pandas as pd
    df=x.copy()
    q95_dict={}
    for col in features:
        q95=np.percentile(df[col],95)
        q95_dict[col]=q95
        b=np.array(df[col])
        c=list(map(lambda x:q95 if x>95 else x,b))
        df=df.drop(col,axis=1)
        df[col]=c
    return df,q95_dict

#用同一标准处理测试集
def add_hat(x,features,q95_dict):
    import numpy as np
    import pandas as pd
    df = x.copy()
    len_d=len(df.index)
    for col in features:
        q95=q95_dict[col]
        b=np.array(df[col])
        c=list(map(lambda x:q95 if x>q95 else x,b))
        df=df.drop(col,axis=1)
        df[col]=c
    return df

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

语亦情非

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
机器学习处理离散值方法之 95分位数盖帽法

def train_add_hat(x,features): import numpy as np import pandas as pd df=x.copy() q95_dict={} for col in features: q95=np.percentile(df[col],95) q95_dict[col]=q95...
复制链接

扫一扫