pandas中inplace_Python处理数据常用方法（pandas版）2

最新推荐文章于 2023-04-12 12:15:40 发布

商界鬼谷子

最新推荐文章于 2023-04-12 12:15:40 发布

阅读量206

点赞数

文章标签： pandas中inplace

本文链接：https://blog.csdn.net/weixin_34014076/article/details/112154065

版权

这篇博客介绍了pandas在数据处理中的常见操作，包括删除列、删除行、重命名列、去重复值、更改数据类型、大小写转换以及填充空值的方法，提供了一系列实用的Python代码示例。

摘要由CSDN通过智能技术生成

书接上回：

Tao：Python处理数据常用方法（pandas版）zhuanlan.zhihu.com

本文为我日常工作中常用功能的代码块，可以满足绝大部分文本数据处理的需求。

首先导入常用的包

import pandas as pd

本文假设所使用的excel文件目录为 C:/Users/Administrator/Desktop

名称为 test.xlsx

df 为定义好的Dataframe格式数据

19 删除一列

df = df.drop(columns=['A'])

源数据：

删除后：

20 删除一行

df = df.drop(index=['3'])

源数据:

删除后:

21 重命名列名 columns

df.rename(columns={'A': 'ABC', 'B': 'BCD','C':'CEF'}, inplace = True)

源数据:

修改后:

22 去重复的值

数据采集可能存在重复的行，这时只要使用 drop_duplicates() 就会自动把重复的行去掉。

df = df.drop_duplicates(inplace=True) # 去除所有数据都重复的行
df = df.drop_duplicates(subset=['A','B']，inplace=True) # 去除AB两列同时重复的行

默认保留第一个重复值，也可以使用keep参数自行设定

源数据：

默认去重后：

加参数去重后:

23 更改数据类型

这是个比较常用的操作，因为很多时候数据格式不规范，我们可以使用 astype 函数来规范数据格式，比如我们把 A字段的值改成 str 类型，或者 int64 可以这么写：

df['A'] = df['A'].astype('str')
df['B'] = df['B'].astype(np.int64

源数据:

源数据类型:

修改后数据类型:

24 大小写转换

大小写是个比较常见的操作，比如人名、城市名等的统一都可能用到大小写的转换，在 Python 里直接使用 upper(), lower(), title() 函数，方法如下：

全部大写

df['A'] = df['A'].str.upper()

全部小写

df['A'] = df['A'].str.lower()

首字母大写

df['A'] = df['A'].str.title()

源数据:

A列转化为大写:

B列转化为小写:

C列首字母大写:

25 使用空值前面的值填补空值

df = df.fillna(method='pad',axis=0)
# 或 
df = df.fillna(method='ffill',axis=0)

源数据:

pandas导入:

向上填充后:

26 使用空值后面的值填补空值

df = df.fillna(method='bfill',axis=0)

源数据及填充后数据:

惯例,十个赞后做下一篇~

商界鬼谷子

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pandas中inplace_Python处理数据常用方法（pandas版）2

书接上回：Tao：Python处理数据常用方法（pandas版）zhuanlan.zhihu.com本文为我日常工作中常用功能的代码块，可以满足绝大部分文本数据处理的需求。首先导入常用的包import pandas as pd本文假设所使用的excel文件目录为 C:/Users/Administrator/Desktop名称为 test.xlsxdf 为定义好的Dataframe格式数据19...
复制链接

扫一扫