python数据框排序_python-在pandas数据框中对行进行排序并获取...

最新推荐文章于 2022-09-27 13:28:29 发布

weixin_39876002

最新推荐文章于 2022-09-27 13:28:29 发布

阅读量649

点赞数

文章标签： python数据框排序

一种使用基础数组数据专注于性能的方法是-

a = df.values

c = df.columns

idx = a.argsort(1)[:,::-1]

vals = a[np.arange(idx.shape[0])[:,None], idx]

IDs = c[idx]

names_vals = ['Max'+str(i+1) for i in range(a.shape[1])]

names_IDs = ['Col_Max'+str(i+1) for i in range(a.shape[1])]

df_vals = pd.DataFrame(vals, columns=names_vals)

df_IDs = pd.DataFrame(IDs, columns=names_IDs)

df_out = pd.concat([df, df_vals, df_IDs], axis=1)

样本输入,输出-

In [40]: df

Out[40]:

A B C D E

0 23 12.0 1 9 123.0

1 24 33.0 33 343 33.0

2 55 0.2 66 4 2.2

3 77 44.0 44 64 42.0

4 33 23.5 5 24 2.0

5 66 66.0 62 63 99.0

In [41]: df_out

Out[41]:

A B C D E Max1 Max2 Max3 Max4 Max5 Col_Max1 Col_Max2 \n0 23 12.0 1 9 123.0 123.0 23.0 12.0 9.0 1.0 E A

1 24 33.0 33 343 33.0 343.0 33.0 33.0 33.0 24.0 D E

2 55 0.2 66 4 2.2 66.0 55.0 4.0 2.2 0.2 C A

3 77 44.0 44 64 42.0 77.0 64.0 44.0 44.0 42.0 A D

4 33 23.5 5 24 2.0 33.0 24.0 23.5 5.0 2.0 A D

5 66 66.0 62 63 99.0 99.0 66.0 66.0 63.0 62.0 E B

Col_Max3 Col_Max4 Col_Max5

0 B D C

1 C B A

2 D E B

3 C B E

4 B C E

5 A D C

如果您需要按顺序输入值和ID,我们需要在此修改最后几步-

df0 = pd.DataFrame(np.dstack((vals, IDs)).reshape(a.shape[0],-1))

df0.columns = np.vstack((names_vals, names_IDs)).T.ravel()

df_out = pd.concat([df, df0], axis=1)

样本输出-

In [62]: df_out

Out[62]:

A B C D E Max1 Col_Max1 Max2 Col_Max2 Max3 Col_Max3 Max4 \n0 23 12.0 1 9 123.0 123 E 23 A 12 B 9

1 24 33.0 33 343 33.0 343 D 33 E 33 C 33

2 55 0.2 66 4 2.2 66 C 55 A 4 D 2.2

3 77 44.0 44 64 42.0 77 A 64 D 44 C 44

4 33 23.5 5 24 2.0 33 A 24 D 23.5 B 5

5 66 66.0 62 63 99.0 99 E 66 B 66 A 63

Col_Max4 Max5 Col_Max5

0 D 1 C

1 B 24 A

2 E 0.2 B

3 B 42 E

4 C 2 E

5 D 62 C

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39876002

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python系列----pandas的排序、排名

weixin_45665432的博客

05-08

1300

Python系列----pandas的排序、排名原数据.sort_index() 索引排序.sort_values() 值排序rank() 排名method参数通用参数总结别忘了点个赞支持一下再走哦~~ 这期主要跟大家介绍pandas的.sort_index()、.sort_values()和rank() 原数据 import pandas as pd df = pd.DataFrame({'b':[1,2,3,2], 'a':[4,3,2,1], 'c':[1,3,8,2]}, index=[2,0,1,

python中sort_index_pandas 数据排序.sort_index()和.sort_values()

weixin_39590635的博客

02-20

1545

import pandas as pddf = pd.DataFrame(……)说明：以下“df”为DataFrame对象。1. df. sort_values()作用：既可以根据列数据，也可根据行数据排序。注意：必须指定by参数，即必须指定哪几行或哪几列；无法根据index名和columns名排序(由.sort_index()执行)调用方式DataFrame.sort_values(by, ax...

参与评论您还未登录，请先登录后发表或查看评论

python数据框排序_对pandas数据框中的每一行进行排序的最快方法

weixin_39736650的博客

12-15

422

再加上“安迪·海登”给出的答案，把这个放在整个画面上。。。不太清楚为什么会这样，但确实如此。订单似乎没有控制权。In [97]: A = pd.DataFrame(np.random.randint(0,100,(4,5)), columns=['one','two','three','four','five'])In [98]: AOut[98]:one two three four f...

python数据框排序_Python-在pandas数据框中自定义排序

weixin_39910043的博客

12-05

1167

小编典典首先，将月份列设为分类，然后指定要使用的顺序。In [21]: df['m'] = pd.Categorical(df['m'], ["March", "April", "Dec"])In [22]: df # looks the same!Out[22]:a b m0 1 2 March1 5 6 Dec2 3 4 April现在，当你对月份列进行排序...

Python列表按照行或列排序

晨少的博客

09-27

1832

Python列表按照行或列排序，想要实现指定某一行或某一列排序，将其换到首行/末行，或者首列/末列后进行排序，再将其换回来即可

unity 根据Transform里子对象的变量值大小顺序，对当前Transform的UI层级进行排序

红叶

08-28

881

添加链接描述传入一个 list , Card 类在在每个子对象身上挂着 /// <summary> /// 对list子对象进行排序 /// m_iCardValue => 为 card 类里的变量 /// </summary> int m_iChildIndex = 0; void SortCards(List<Card> m_sCard) {

python 数据分析usagov_bitly_data2012-03-16-1331923249.txt.zip

12-24

Python数据分析是现代数据科学中的重要工具，特别是在处理和理解大量数据时。本学习资料"python 数据分析usagov_bitly_data2012-03-16-1331923249.txt.zip"聚焦于使用Python解析和分析实际的数据集——usagov_bitly_...

Python库 | pandas_plink-2.2.0-cp37-cp37m-win_amd64.whl

03-22

这个库的主要目标是简化对PLINK数据集的处理，使用户能够利用Python的强大功能，特别是数据分析库pandas，进行数据探索、清洗、转换和统计分析。标题中的"pandas_plink-2.2.0-cp37-cp37m-win_amd64.whl"表示这是一...

python源码-案例框架-自动办公-27 Python从多路径多Excel表中获取数据并存入新表.zip

热门推荐

立身以力学为先，力学以读书为本。 —郑耕老《劝学》

08-16

7万+

一、定义数据框DataFrame import pandas frame = pandas.DataFrame({"a":[9,2,5,1],"b":[4,7,-3,2],"c":[6,5,8,3]}) frame Out[53]: a b c 0 9 4 6 1 2 7 5 2 5 -3 8 3 1 2 3 二、按列对DataFrame排序 1

python对数据排序_Python每n行对数据排序？

weixin_39519769的博客

02-10

272

我有以下数据# Data set number 1## Number of lines 4081## Max number of column 3 is 5# Blahblah# The explanation about each rows3842 1 1 3843 0 0.873 0.922 0.000 0.3173843 2 2...

python:按行读入，排序然后输出

张俊杰的博客

05-26

1万+

题目描述给定n个字符串，请对n个字符串按照字典序排列。输入描述:输入第一行为一个正整数n(1≤n≤1000),下面n行为n个字符串(字符串长度≤100),字符串中只含有大小写字母。输出描述:数据输出n行，输出结果为按照字典序排列的字符串。示例1输入9 cap to cat card two too up boat boot输出boat boot cap card cat to too two up...

Pandas DataFrame 按照一列数据的特定顺序进行排序

凞懿的博客

07-31

1万+

原理：先把该列转成category 格式，再弄一个排好序的列表，导入排序即可 dis3 = data3.groupby('distance_group')['case0'].count().reset_index() list_dis = ['gps incomplete', 'no move', 'in 5 meters', 'in 50 meters','in 500 meters','in 5 km','in 50 km','out 50 km'] dis3['distance_group'] =

vue标准时间改为时间戳_Python时间序列之时间戳

weixin_39978696的博客

11-19

294

一起学习，一起成长！Pandas最基本的时间序列类型就是以时间戳(通常以Python字符串或datetime对象表示)为索引的Series：In [1]: import numpy as npIn [2]: import pandas as pdIn [3]: from pandas import Series,DataFrameIn [4]: from datetime import datet...

3、python数据框基本操作、切片、合并、排序

UP Lee博客

11-28

4291

目录一、基本操作：二、通过切片获取数据三、数据排序四、数据行、列的合并一、基本操作： DataFrame行数：len(data) DataFrame列数：len(data.ix[1]) 查看行数和列数：data.shape 二、通过切片获取数据 1、loc通过行号和列名截取数据框： df.loc[0, '消费'] df.loc[2:3, ['a', 'b']]...

python营业数据分析_小案例-使用python进行销售数据分析

05-21

好的，我们可以采用Python中的pandas和matplotlib库进行营业数据分析。下面我介绍一下具体的实现步骤。首先，我们需要准备一份销售数据的CSV文件，例如以下示例数据： ``` 日期,商品名称,销售额,销售量 2021-01-01,商品A,1000,10 2021-01-01,商品B,1500,15 2021-01-02,商品A,1200,12 2021-01-02,商品B,1800,18 2021-01-03,商品A,1300,13 2021-01-03,商品B,1900,19 ``` 然后，我们可以使用pandas库将CSV文件读取到数据框中，并进行一些数据清洗和处理。代码如下： ```python import pandas as pd # 读取CSV文件到数据框 df = pd.read_csv('sales_data.csv') # 将日期列转换为datetime类型 df['日期'] = pd.to_datetime(df['日期']) # 添加月份列 df['月份'] = df['日期'].dt.month # 添加销售额/销售量单价列 df['销售额单价'] = df['销售额'] / df['销售量'] df['销售量单价'] = df['销售量'] / df['销售额'] ``` 接着，我们可以使用pandas的聚合函数对数据进行汇总和统计。例如，我们可以按月份汇总销售额和销售量，代码如下： ```python # 按月份汇总销售额和销售量 df_monthly = df.groupby('月份').sum()[['销售额', '销售量']] ``` 然后，我们可以使用matplotlib库绘制图表，例如绘制销售额和销售量的折线图，代码如下： ```python import matplotlib.pyplot as plt # 绘制销售额和销售量的折线图 plt.plot(df_monthly.index, df_monthly['销售额'], label='销售额') plt.plot(df_monthly.index, df_monthly['销售量'], label='销售量') # 添加图表标题和标签 plt.title('销售额和销售量月度趋势') plt.xlabel('月份') plt.ylabel('金额/数量') plt.legend() # 显示图表 plt.show() ``` 最后，我们可以通过对数据框进行筛选和排序，来查找一些有用的信息。例如，我们可以查找销售额单价最高的商品，代码如下： ```python # 查找销售额单价最高的商品 df_top = df.sort_values('销售额单价', ascending=False).head(1) # 输出商品名称和销售额单价 print(f"销售额单价最高的商品是{df_top.iloc[0]['商品名称']}, 单价为{df_top.iloc[0]['销售额单价']:.2f}") ``` 以上就是一个简单的营业数据分析案例，希望对您有所帮助。