python中Dataframe统计的时候注意事项

最新推荐文章于 2024-07-18 10:16:50 发布

qq_43258328

最新推荐文章于 2024-07-18 10:16:50 发布

阅读量376

点赞数

文章标签： python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43258328/article/details/120118398

版权

1、在python中在dataframe中None会被当做不存在，不统计在内，在sum()和mean()的时候不计算在内，这样就不用手动去进行去除0的操作啦！
注意：是赋值为None，而不是np.NaN

2、元素如果是np.float64类型的，可以用df.round(3)等四舍五入的方法来操作，速度很快，
注意：一定要是np.float64的，如果是float的类型的是不行的！如果某些列是float类型，则对这些列进行round()操作会失效，而np.float64的列操作是有效的。

3、可以用这个把NaN替换为0，这是打补丁的方法，尽量不用。
sums = sums.where(sums.notnull(), 0) # 将dataframe中的NaN 替换为 0

4、默认的时候，Dataframe中数字都是np.float64, 如果对某一列的某一个值的类型进行了改变，比如赋值为Decimal(‘1.1”) 则这一列的其他数字类型就会变成float 而不是np.float64了。而且变不回来了。

5、df.round(3) 函数只对整列都是np.float64的数字有效！对于其他类型（float、decimal）则自动失效。

6、经过df.mean() 以后，类型是pandas.core.series.Series，如果成功的话，不论df里是什么类型的，df.mean()里面的数字类型就又变成了np.float64的了，那么使用df.mean().round(3)方法是可行的

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python中Dataframe统计的时候注意事项

1、在python中在dataframe中None会被当做不存在，不统计在内，在sum()和mean()的时候不计算在内，这样就不用手动去进行去除0的操作啦！注意：是赋值为None，而不是np.NaN2、元素如果是np.float64类型的，可以用df.round(3)等四舍五入的方法来操作，速度很快，注意：一定要是np.float64的，如果是float的类型的是不行的！如果某些列是float类型，则对这些列进行round()操作会失效，而np.float64的列操作是有效的。3、可以用这个把Na
复制链接

扫一扫

qq_43258328

CSDN认证博客专家 CSDN认证企业博客

码龄6年

2: 原创

17万+: 周排名

115万+: 总排名

968: 访问

: 等级

44: 积分

0: 粉丝

0: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

最新评论

drf序列化器嵌套
qq_43258328: 加点就行。
drf序列化器嵌套
Tsinghua_renyi: 请问方法2怎么返回指定的字段

最新文章

drf序列化器嵌套

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。