DataFrame某些列值替换的三种方式

DataFrame某些列值替换的三种方式

通过自定义函数,对DataFrame数据的几列值进行替换。

import numpy as np
import pandas as pd

data = pd.read_csv(r'C:\Users\Administrator\Desktop\ASC_Model\service_loan.csv', encoding='gbk')
方法一
def dataprocess(data):
    for columns in('EMAILADD','QQNO','WECHAT'):
        data[columns] = data[columns].isnull().map({True:0,False:1})
    return data
方法二
def dataprocess(data):
    for col in ('EMAILADD','QQNO','WECHAT'):
        data[col]=data[col].isnull()
        data[col]=data[col].map({True:0,False:1})
    return data
方法三
def dataprocess(data):
    for col in ('EMAILADD','QQNO','WECHAT'):
        data[col] = np.where(data[col].isnull(),0,1)
    return data
data = dataprocess(data)

print(data[['EMAILADD','QQNO','WECHAT']].head(10))
  • 6
    点赞
  • 57
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
处理 DataFrame 中的异常通常需要进行以下步骤: 1. 找到异常:使用统计学方法,如分位数和标准差,来确定异常的范围。 2. 替换异常:将异常替换为均、中位数或其他代表性。 3. 删除异常:如果异常数量较少,可以考虑删除这些异常。 4. 分组处理:对于某些情况下,可以根据数据的特征将数据进行分组,然后在每个组中处理异常。 下面是一些使用 pandas 处理异常的示例代码: 1. 找到异常 ```python # 使用分位数找到异常 q1 = df['column_name'].quantile(0.25) q3 = df['column_name'].quantile(0.75) iqr = q3 - q1 lower_bound = q1 - 1.5*iqr upper_bound = q3 + 1.5*iqr # 找到在上界和下界之外的异常 outliers = df[(df['column_name'] < lower_bound) | (df['column_name'] > upper_bound)] ``` 2. 替换异常 ```python # 将异常替换为均 mean_value = df['column_name'].mean() df.loc[(df['column_name'] < lower_bound) | (df['column_name'] > upper_bound), 'column_name'] = mean_value ``` 3. 删除异常 ```python # 删除异常 df.drop(df[(df['column_name'] < lower_bound) | (df['column_name'] > upper_bound)].index, inplace=True) ``` 4. 分组处理 ```python # 将数据根据某列分组 grouped = df.groupby('group_column') # 对每个组的异常进行替换 for group_name, group_data in grouped: q1 = group_data['column_name'].quantile(0.25) q3 = group_data['column_name'].quantile(0.75) iqr = q3 - q1 lower_bound = q1 - 1.5*iqr upper_bound = q3 + 1.5*iqr mean_value = group_data['column_name'].mean() group_data.loc[(group_data['column_name'] < lower_bound) | (group_data['column_name'] > upper_bound), 'column_name'] = mean_value ```
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值