【20211029】【Python】删除 DataFrame 中的某行、某列

本文介绍了Pandas库中的drop方法用于数据清理的两种主要方式:按行删除和按列删除,并提供了具体示例。此外,还讨论了Python中常见的数据清理方法,包括删除无效项(如使用isnull()和dropna())和填充空缺项(如fillna())。强调drop方法不会改变原始DataFrame,而是返回新的数据集。同时,文章列举了数据清理的多种策略,帮助提升数据质量。
摘要由CSDN通过智能技术生成

        pandas 中的 drop 方法是很明智的数据清理的方法,它的好处在于:它不改变原有的 df 中的数据,而是返回另一个新的 DataFrame 来存放删除后的数据。


一、drop 的用法

import pandas as pd
import numpy as np

a = list(range(1, 11))
a_reshape = np.array(a).reshape(2, 5).T
b = pd.DataFrame(a_reshape)
print(b)

1. df.drop([row_num], axis=0):删除 DataFrame 某一行(如果不指定axis,那么默认axis=0)

c = b.drop(0, axis=0)
print(c)

2. df.drop([row_num], axis=1):删除 DataFrame 某一列

d = b.drop(0, axis=1)
print(d)

        (参考:pandas DataFrame行或列的删除方法的实现示例) 


二、python 中数据清理的常见方法

1. 删除无效项

        (1)df[df.isnull()] 和 df[df.notnull()]:df.isnull() 和 df.notnull() 返回的是一个 true 或 false 的 Series对象,所以这种方式可以筛选出我们需要的特定数据。

        (2)df.dropna():将所有含有 nan 项的 row 删除(默认:axis=0) 。

        (3)df.dropna(axis=1, thresh=3):将在列方向上有三个为 nan 的列删除。

        (4)df.dropna(how='ALL'):将全部项都是 nan 的 row 删除。

2. 填充空缺项

        (1)df.fillna(0)

        (2)df.fillna({1:0, 2:0.5}):对第一列 nan 值赋0,第二列赋值 0.5;

        (3)df.fillna(method='ffill'):在列方向上用前一个值赋值给 nan。

        (参考:python进行数据清理之pandas中的drop用法


Tips:

1. 注意:drop() 方法不改变原有的 df 数据!

b.drop(0, axis=1)
print(b)

 

  • 17
    点赞
  • 105
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Satisfying

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值