【数据平台】pandas按条件去重

最新推荐文章于 2024-03-02 21:19:46 发布

fjssharpsword

最新推荐文章于 2024-03-02 21:19:46 发布

阅读量4.4k

点赞数 2

分类专栏： Big data python专栏

本文链接：https://blog.csdn.net/fjssharpsword/article/details/78684672

版权

Big data 同时被 2 个专栏收录

195 篇文章 6 订阅

订阅专栏

python专栏

114 篇文章 48 订阅

订阅专栏

场景：按 A 列去重，保留 B 列中最小的一行数据。

# -*- coding: utf-8 -*-
'''
@author: user
'''
import pandas as pd

data = [[1,1,1,2,3,3], [0.2,0.3,0.4,0.1,0.2,0.4]]
data = pd.DataFrame(data)
data = [[1,1,1,2,3,3], [0.2,0.3,0.4,0.1,0.2,0.4]]
data = pd.DataFrame(data).T
data.columns=['A', 'B']
print (data)
#按 A 列去重，保留 B 列中 最小的一行数据。
#方法一：
print (data.groupby('A', as_index=False)['B'].min())
#方法二:
print(data.pivot_table(index='A', columns=None, values='B', aggfunc=min) )
#方法三：
data.sort_values(by=['B'],ascending=True)
print (data.drop_duplicates(['A']))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

fjssharpsword

关注关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
2
评论
【数据平台】pandas按条件去重

场景：按 A 列去重，保留 B 列中最小的一行数据。# -*- coding: utf-8 -*-'''@author: user'''import pandas as pddata = [[1,1,1,2,3,3], [0.2,0.3,0.4,0.1,0.2,0.4]]data = pd.DataFrame(data)data = [[1,1,1,2,3,3], [
复制链接

扫一扫