python dataframe 合并乱序列表_Python数据处理--删除重复项、数值替换和表合并

最新推荐文章于 2023-12-22 15:02:20 发布

weixin_39694174

最新推荐文章于 2023-12-22 15:02:20 发布

阅读量378

点赞数

文章标签： python dataframe 合并乱序列表 python dataframe合并 python 两个数据框合并计算 python 删除特定行数据 pythondataframe的值替换函数 python数据预处理之整体替换

导入需要的包：numpy、pandas

import numpy as py

import pandas as pd

创建一个表：

Python处理重复数据

drop_duplicates函数删除重复值。以city列为例，city字段中存在重复值。默认情况下drop_duplicates()将删除后出现的重复值。增加keep=‘last’参数后将删除最先出现的重复值，保留最后的值。下面是具体的代码和比较结果。

df["city"].drop_duplicates()

保留先出现的重复值

保留后面出现的重复值

Python中使用replace函数实现数据替换。数据表中city字段上海存在两种写法，分别为shanghai和SH。我们使用replace函数对SH进行替换。

替换值

首先是对不同的数据表进行合并，我们这里创建一个新的数据表df1，并将df和df1两个数据表进行合并。python中通过merge函数一次性实现。下面建立df1数据表，用于和df数据表进行合并。

使用merge函数对两个数据表进行合并:

用inner方式合并

除了inner方式以外，合并的方式还有left，right和outer方式。只要在how=“left/right/outer”

关注