pandas 计算有缺失值的行数或者列数

筛选出有缺失值的行或者列

# 筛选出有缺失值的列:
df.isnull().any()
# 筛选出有缺失值的行:
df.isnull().T.any()

计算有缺失值的行数或者列数

# 计算有缺失值的列数:
df.isnull().any().sum()
# 计算有缺失值的行数目:
df.isnull().T.any().sum()
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
抽取合适的数和数通常需要考虑以下几个方面: 1. 样本大小:样本大小通常是根据研究目的和研究设计来确定的。例如,如果您想对整个数据集进分析,则需要抽取全部;如果您只关注数据集的一部分,或者想抽取一个代表性的样本进分析,则需要抽取适当的。 2. 数据分布:如果您想研究数据分布的特征,例如均、方差等,则需要抽取全部;如果您只关注数据的某些方面,例如峰度、偏度等,则可以抽取部分。 3. 数据质量:如果数据集中存在缺失、异常或错误,则需要选择合适的,以保证分析结果的准确性和可靠性。通常需要对数据进预处理,例如填补缺失、删除异常或修正错误等。 4. 计算资源:如果数据集非常大,超出了计算机的处理能力,则需要抽取部分分析,以免计算机崩溃或运时间过长。 根据以上几个方面,您可以选择适当的抽取。在Python中,您可以使用Pandas库中的iloc和loc方法来进抽取。例如,以下代码从名为“data”的DataFrame中抽取前100和前5: ```python sub_data = data.iloc[:100, :5] ``` 如果您想根据某些条件进抽取,则可以使用loc方法。例如,以下代码从名为“data”的DataFrame中抽取“column_name”中数大于10的前100: ```python sub_data = data.loc[data['column_name'] > 10].iloc[:100, :] ``` 希望这些信息对您有所帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值