python为什么会出现nan_NaN为何会凭空产生?

在项目中,作者遇到Python数据处理时出现'nan'错误,尝试过滤负值工作经验并用中位数替换。经过排查,发现不是原始数据包含'nan',而是matplotlib库存在bug导致运行时报错。更新matplotlib库后问题解决。
摘要由CSDN通过智能技术生成

在做项目时遇到了一个错误:

#过滤出正常的工作经验值数据集合不正常的工作经验布尔值

dfExp=data.query('Experience>0')

negExp=data.Experience<0

mylist=data.loc[negExp]['ID'].tolist()

#对每一个工作经验为负的样本,用同年龄和教育程度的工作经验均值代替

for id in mylist:

age=data.query('ID==@id').Age.tolist()[0]

education=data.query('ID==@id').Education.tolist()[0]

df_filtered=dfExp.query('Age==@age and Education==@education')

exp=df_filtered['Experience'].median()

if exp is not np.nan:

exp=data.Experience.median()

data.loc[data.query('ID==@id').index,'Experience']=exp

print(data.Experience.describe())

sns.distplot(data.Experience)

上面这一段代码,目的是通过for循环把数据下Experience(工作经验)列中的异常值,即负值进行清洗,因为工作经验与年

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值