cannot index with vector containing NA / NaN values

关于这个小问题,其实是pandas使用中经常出现的问题。具体原因就是在dataframe里面nan是一个特殊的存在,因为你的数据里包含nan或者inf类型的数据类型,所以你在对这一数据进行处理时,就会出现标题上出现的错误。

怎么解决呢?

方法也是有很多的,这里举一个简单的方法,但是绝对不是最科学的方法,

df['近期销量']=df['近期销量'].replace(np.nan,'0').astype(int)
df=df.sort_values(by='近期销量',ascending=False)

这里是用字符串形式的0将nan给替换了,当然你也可以用pandas里面的fiina()函数进行处理,但是要注意处理的范围,因为数据里的维度比较多,很可能将所有的nan都处理掉了。

df[['城市','省份']]=df[['城市','省份']].fillna('暂无')

总结:在进行数据处理之前,要对数据内容进行预处理,预处理是就要对数据的异常值进行处理,这是要保证数据的质量问题,也是保证数据分析结果的科学性。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值