python去重复排序_python – 组内的Pandas排序导致重复索引

最新推荐文章于 2022-02-14 22:03:47 发布

weixin_39907526

最新推荐文章于 2022-02-14 22:03:47 发布

阅读量79

点赞数

文章标签： python去重复排序

我有一个pandas DataFrame,格式如下：

C1 C2

A 0 1.764052 0.400157

1 0.978738 2.240893

2 1.867558 -0.977278

3 0.950088 -0.151357

4 -0.103219 0.410599

C 0 0.144044 1.454274

1 0.761038 0.121675

2 0.443863 0.333674

3 1.494079 -0.205158

4 0.313068 -0.854096

它是从这段代码生成的：

import pandas as pd

import numpy as np

idx = pd.MultiIndex.from_product([['A','C'],range(5)])

np.random.seed(0)

df = pd.DataFrame(index=idx, data = np.random.randn(len(idx), 2), columns=['C1','C2'])

我想按列C1分别对每个组(第一个索引级别)进行排序,所以我使用groupby函数：

df.groupby(level = 0).apply(lambda x：x.sort_values(‘C1’))

我得到了结果：

C1 C2

A A 4 -0.103219 0.410599

3 0.950088 -0.151357

1 0.978738 2.240893

0 1.764052 0.400157

2 1.867558 -0.977278

C C 0 0.144044 1.454274

4 0.313068 -0.854096

2 0.443863 0.333674

1 0.761038 0.121675

3 1.494079 -0.205158

为什么第一级重复？有没有更好的方法来对每个组中的数据进行排序？

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39907526

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Pandas之排序函数sort_values()的实现

12-31

pandas中的sort_values()函数原理类似于SQL中的order by，可以将数据集依照某个字段中的数据进行排序，该函数即可根据指定列数据也可根据指定行的数据排序。二、sort_values()函数的具体参数用法： DataFrame....

如何解决python列表中重复值的索引问题

weixin_37493499的博客

08-25

2464

比如有一个列表 a=[1,2,3,4,4] 当我使用a.index(4)求索引的时候，只会返回第一个4的索引3，而在数据处理中往往需要把两个4的索引都取出来。提供一种解决思路就是使用enumerate() a=[1,2,3,4,4] for i,element in enumerate(a): if element==4: print(i) 当然这是简单的示例，真正应用实际项目中可以玩的很花。 ...

参与评论您还未登录，请先登录后发表或查看评论

python处理问题汇总二(重复值索引，顺序读取文件，drop函数，数组元素排名)

小朱小朱绝不认输的博客

07-26

1015

1. python处理重复值索引问题 python3 的index函数只能索引要查找元素的首个索引，这个在多数情况是不能满足索引要求的。 listA = [1, 2, 3, 2] print(listA.index(2)) 1 而enumerate函数可以遍历所有元素，可以利用这个函数+列表推导式实现获取所有重复元素的索引值。 listA = [1, 2, 3, 2] #比如要查找列表中的数字2。 indexA = [x for (x, m) in enumerate(listA) if m == 2

python算法：删除排序数组中的重复项

Lindons的博客

05-18

1556

删除排序数组中的重复项给定一个排序数组，你需要在原地删除重复出现的元素，使得每个元素只出现一次，返回移除后数组的新长度。不要使用额外的数组空间，你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。这个问题的主要难点是，删除一个元素后，后面的元素索引会跟着改变。这里用了两个方法，都可以正常运行得到正确答案，而方法一的思路是：每删除一个元素，就从头开始重新检测一遍，这样就不用考虑索引的问题，但是因为需要频繁的重新检测，当输入的数据非常庞大的时候，这个算法的运算速度就会变得非常缓

Python实现删除排序数组中的重复项

修炼之路

02-22

5027

题目描述给定一个排序数组，你需要在原地删除重复出现的元素，使得每个元素只出现一次，返回移除后数组的新长度。不要使用额外的数组空间，你必须在原地修改输入数组并在使用O(1)额外空间的条件下完成。 LeetCode原题地址：https://leetcode-cn.com/problems/remove-duplicates-from-sorted-array/ 测试用例示例1 给定数组 nums = [1,1,2], 函数应该返回新的长度 2, 并且原数组 nums 的前两个元素被修改为 1, 2。

pandas多重索引分别按索引排序

雪山飞狐

12-18

2196

设有如下的多重索引的dataframe 要实现的功能为，按ID列降序，number列升序排列 dataframe.sort_index(level=[0,1],ascending=[False,True])

python sort、sort_index方法代码实例

09-19

在Python的数据处理中，尤其是在使用Pandas库时，数据排序是一项非常常见的操作。本篇文章将详细解释`sort`和`sort_index`这两个方法，并通过具体的代码示例来展示它们的用法。 #### 一、`sort`方法简介在Pandas...

Python系列—-pandas的排序、排名

12-20

在Python的pandas库中，数据操作经常涉及到排序和排名，这对于数据分析和处理至关重要。本篇文章将详细讲解如何使用`.sort_index()`、`.sort_values()`和`rank()`这三个方法来实现这一目标。首先，`.sort_index()`...

pandas官方文档中文版_python教程_pandas中文API_pandas中文_

10-02

**Pandas：Python数据分析的基石** Pandas是Python编程语言中的一个强大且广泛使用的数据分析库。它为数据清洗、处理、分析和可视化提供了一系列高效工具，使得数据科学家和分析师能够轻松地进行数据操作。Pandas...

pandas官方文档中文版_pandas_pandas文档_python_

10-02

**Pandas：Python数据分析的得力工具** Pandas是Python编程语言中用于数据处理和分析的一个强大库。它提供了一套高效的数据结构，使得数据清洗、转换、聚合、建模等任务变得简单易行。Pandas的核心是DataFrame对象...

【python】DataFrame 删除重复值，重新设置索引: reindex 和 reset_index

Hurpe

05-07

6017

删除重复行 df = df.drop_duplicates() 纵向合并 DataFrame df_1 = pd.DataFrame() df_2 = pd.DataFrame() df = pd.concat([df_1, df_2], axis=0) 合并完DataFrame之后，各自索引不会变化（010，010），需要重置索引（0~21） df = df.reset_i...

[Pandas] 索引排序 df.sort_index()

Hudas的博客

02-14

9174

[Pandas] 索引排序 df.sort_index()

Python基于机器学习的金融大数据风控建模实战源码+数据+pkl模型文件.zip

最新发布

10-10

Python基于机器学习的金融大数据风控建模实战源码+数据+pkl模型文件.zip

springcloud

10-10

springcloud

Java项目: 基于SpringBoot+mybatis+maven+vue+mysql在线教育系统(含源码+数据库+毕业论文)

10-10

一、项目简介包含：项目源码、数据库脚本等，该项目附带全部源码可作为毕设使用。项目都经过严格调试，eclipse或者idea 确保可以运行！该系统功能完善、界面美观、操作简单二、技术实现 jdk版本：1.8 及以上 ide工具：IDEA或者eclipse 数据库: mysql5.5及以上后端：spring+springboot+mybatis+maven+mysql 前端: vue , css，js , elementui 三、系统功能 1、系统角色主要包括：管理员、用户、讲师 2、系统功能后台主要功能包括：首页个人中心修改密码个人信息用户管理讲师管理普通管理员管理课程管理员管理课程管理课程分类管理教师管理名师管理系统管理订单管理前台功能包括：用户登录用户注册首页课程信息推荐课程详情点我收藏添加到购物车立即购买发表评论教师信息推荐个人中心我的收藏余额充值后台管理购物车等功能详见 https://flypeppa.blog.csdn.net/article/details/142827942

纸板码垛程序，码垛动画仿真，采用博图v16编程，西门子S7-1200码垛程序，仿真效果如图所示，可以实现纸板纸箱的动态码垛，为

10-10

纸板码垛程序，码垛动画仿真，采用博图v16编程，西门子S7-1200码垛程序，仿真效果如图所示，可以实现纸板纸箱的动态码垛，为PLC程序+电路图

实变函数第一章集合与点集部分课程笔记

10-10

资源是作者在学习实变函数过程中总结的一些重要定理、方法和命题。适合学习实变函数论的大学生使用，后续会持续更新后面几章的课程笔记。

Servlet+JSP装备展示与销售平台答辩PPT.pptx

10-10

计算机毕业设计答辩PPT

CPA 税法马兆瑞基础班-第8章-契税法（2）+耕地占用税法.pdf

10-10

CPA 税法马兆瑞基础班-第8章-契税法（2）+耕地占用税法.pdf