pandas去重保留前一条或后一条 drop_duplicates、打乱列表顺序 random.shuffle()的使用方法、pandas 按行遍历Dataframe

最新推荐文章于 2024-05-24 20:45:17 发布

愚昧之山绝望之谷开悟之坡

最新推荐文章于 2024-05-24 20:45:17 发布

阅读量477

点赞数

分类专栏：笔记 python 文章标签： pandas

本文链接：https://blog.csdn.net/qq_15821487/article/details/131931155

版权

笔记同时被 2 个专栏收录

649 篇文章 16 订阅

订阅专栏

python

344 篇文章 10 订阅

订阅专栏

pandas去重保留前一条或后一条 drop_duplicates

参考：https://blog.csdn.net/weixin_42690752/article/details/103464588

pandas库中的drop_duplicates()函数简直就是去重的神器，该函数还可以在去重中人为设置保留靠前的记录还是靠后的记录。
DataFrame.drop_duplicates(self, subset=None, keep='first', inplace=False)[source]

一共有三个参数，subset、keep和inplace

subset参数
subset : column label or sequence of labels, optional
Only consider certain columns for identifying duplicates, by default use all of the columns

subset参数用来设置以哪些列的重复作为重复的标准，参数为列标签，如果不设置该值，则默认为以所有列作为重复的判断条件。

keep参数
keep : {‘first’, ‘last’, False}, default ‘first’
first : Drop duplicates except for the first occurrence.
last : Drop duplicates except for the last occurrence.
False : Drop all duplicates.

keep可以设置为三个参数，默认为first
first表示保留第一次出现的记录
last表示保留最后一次出现的记录
False表示把所有重复的删除

inplace参数
inplace : boolean, default False
Whether to drop duplicates in place or to return a copy

inplace可以设置为True或False，默认为False
True表示原地去重，会改变dataframe
False表示会返回一个新的dataframe，不会改变原来的变量

pandas 按行遍历Dataframe

参考：https://blog.csdn.net/d1240673769/article/details/112407978

for index,row in df.iterrows():
    print(index,type(row),row['code'],row['name']) 
    #对于每一行，通过列名访问对应的元素
    print("-----")

打乱列表顺序 random.shuffle()的使用方法

# shuffle()使用样例
import random

x = [i for i in range(10)]
print(x)
random.shuffle(x)
print(x)

愚昧之山绝望之谷开悟之坡

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pandas去重保留前一条或后一条 drop_duplicates、打乱列表顺序 random.shuffle()的使用方法、pandas 按行遍历Dataframe

【代码】pandas去重保留前一条或后一条 drop_duplicates、打乱列表顺序 random.shuffle()的使用方法、pandas 按行遍历Dataframe。
复制链接

扫一扫