python中Dataframe统计的时候注意事项

1、在python中在dataframe中None会被当做不存在,不统计在内,在sum()和mean()的时候不计算在内,这样就不用手动去进行去除0的操作啦!
注意:是赋值为None,而不是np.NaN

2、元素如果是np.float64类型的,可以用df.round(3)等四舍五入的方法来操作,速度很快,
注意:一定要是np.float64的,如果是float的类型的是不行的!如果某些列是float类型,则对这些列进行round()操作会失效,而np.float64的列操作是有效的。

3、可以用这个把NaN替换为0,这是打补丁的方法,尽量不用。
sums = sums.where(sums.notnull(), 0) # 将dataframe中的NaN 替换为 0

4、默认的时候,Dataframe中数字都是np.float64, 如果对某一列的某一个值的类型进行了改变,比如赋值为Decimal(‘1.1”) 则这一列的其他数字类型就会变成float 而不是np.float64了。而且变不回来了。

5、df.round(3) 函数只对整列都是np.float64的数字有效!对于其他类型(float、decimal)则自动失效。

6、经过df.mean() 以后,类型是pandas.core.series.Series,如果成功的话,不论df里是什么类型的,df.mean()里面的数字类型就又变成了np.float64的了,那么使用df.mean().round(3)方法是可行的

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值