【机器学习】【数据处理】Pandas 处理缺失值

最新推荐文章于 2024-06-23 23:31:23 发布

白糖炒栗子~

最新推荐文章于 2024-06-23 23:31:23 发布

阅读量1k

点赞数

分类专栏： Python Pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41571493/article/details/80631343

版权

目前很多流行的数据集都会存在数据缺失的现象。

一般我们在用Pandas处理缺失值的方法有两种：

1.用覆盖全局的掩码来表示缺失值.(用布尔类型来代替原先数据/用0或1来表示)

2.用一个标签值来表示缺失值.(用一个具体的自定义的数据来表示，如-9999. 或用None或NaN)

1.缺失值

具体使用哪种方法还需要看具体情况：

1.用掩码来处理会额外构造一个布尔数组，会增加存储

2.标签值方法缩小了可以被表示的有效值的范围，会增加额外的计算逻辑。而且NaN也不能够表示所有数据类型。

Pandas的缺失值：1.Python对象类型的缺失值None（Python中不能将None与整数相加）

2.数值类型对象的缺失值NaN（NaN是一种特殊的浮点数，不是整数、字符串等其它数据类型；

且无论对和NaN做哪种操作，最终结果都是NaN）

Pandas中NaN与None的差异：实际上，Pandas把他们看成是可以等价交换的，合适的时候会将他们进行替换。

import pandas as pd
import numpy as np

最低0.47元/天解锁文章

白糖炒栗子~

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】【数据处理】Pandas 处理缺失值

目前很多流行的数据集都会存在数据缺失的现象。一般我们在用Pandas处理缺失值的方法有两种： 1.用覆盖全局的掩码来表示缺失值.(用布尔类型来代替原先数据/用0或1来表示) 2.用一个标签值来表示缺失值.(用一个具体的自定义的数据来表示，如-9999. 或用None或NaN)1.缺失值具体使用哪种方法还需要看具体情况： ...
复制链接

扫一扫

专栏目录

白糖炒栗子~ CSDN认证博客专家 CSDN认证企业博客

码龄7年

34: 原创

12万+: 周排名

158万+: 总排名

56万+: 访问

: 等级

3456: 积分

278: 粉丝

778: 获赞

130: 评论

2892: 收藏

私信

关注

热门文章

分类专栏

Python 34篇
Pandas 9篇
Numpy 4篇
机器学习 4篇
计算机理论基础 1篇
Kaggle 1篇
JAVA 5篇
JavaFX 1篇
Python爬虫 3篇
Matplotlib 1篇
Mathematica
Blog
Jupyter 1篇
生活

最新评论

【数据处理】Numpy.random.seed()的用法
AIhub: 不知道为什么这么多捧哏。在我看来，博主理解的seed()的作用范围是错的。即使没有重新设置seed，第二次随机生成的值仍然在seed的作用范围下，至于与第一次生成的随机数不同，是因为seed会同时生成很多值，而每次一取值，会在第一次取的值后面取。比如同时生成1，2，3，4，5，6. 第一次运行random 生成了 1，如果没有重新seed，第二次会取2，以此类推。如果重新seed，则从1重新开始取。而不是博主说的，不重新seed， random 取值就不再seed 的作用范围之下～
蓝桥杯——教你搭建蓝桥杯Java环境
2303_80735261: 百度网盘下完后，没有jdk1.6是怎么回事
JavaFX极简入门（利用FXML文件）到精通
约瑟夫不洗脚: 直接用scenebuilder拖拽按钮控件这些响应事件的话就用注解绑定一下,但是我感觉这个自己做一个小系统的话就非常简单,如果说要真正的去做人家需求的话可能用不到这个,
JavaFX极简入门（利用FXML文件）到精通
约瑟夫不洗脚: 我学了挺简单的
JavaFX极简入门（利用FXML文件）到精通
qq_34041974: 所以你最后学了没。。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。