报错报错报错

def feature_deal(data):
    data.drop(columns=['itemCode'],inplace=True)
    label_feature = ['defectName-1','defectName-2']
    null_precentile = data.isnull().sum() / len(data) 
    dropcol_list1 = null_precentile[null_precentile.values > 0.97].index.tolist()                                                      #删除掉空值超过百分之97的特征
    data.drop(columns=dropcol_list1,inplace=True)
    text_columns = [col for col in data.columns if data[col].apply(lambda x: isinstance(x, str) and len(x) >= 50).any()]               #筛出文本特征
     
    categorical_columns = data.select_dtypes(include=['object']).columns.to_list()
    dropcol_list2 = label_feature + text_columns
    
    categorical_columns = [cat for cat in categorical_columns if cat not in dropcol_list2]                                             #筛选类别特征
    print(categorical_columns)
    for col in categorical_columns:                                                                                                    #类别特征编码
        data[col] = data[col].str.strip()                   
        data[col] = data[col].astype('str')                                                                                            #保证所有列值类型一致
    return data
def feature_deal(data):
    data.drop(columns=['itemCode'],inplace=True)
    label_feature = ['defectName-1','defectName-2']
    null_precentile = data.isnull().sum() / len(data) 
    dropcol_list1 = null_precentile[null_precentile.values > 0.97].index.tolist()                                                      #删除掉空值超过百分之97的特征
    data.drop(columns=dropcol_list1,inplace=True)
    text_columns = [col for col in data.columns if data[col].apply(lambda x: isinstance(x, str) and len(x) >= 50).any()]               #筛出文本特征
     
    categorical_columns = data.select_dtypes(include=['object']).columns.to_list()
    dropcol_list2 = label_feature + text_columns
    
    categorical_columns = [cat for cat in categorical_columns if cat not in dropcol_list2]                                             #筛选类别特征
    print(categorical_column

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值