python数据框提取子集_python-如何对熊猫数据框中的行子集进行排...

我有以下数据框:

import pandas as pd

df = pd.DataFrame({'FavCol' : ['Fixy','Macky', 'querk', 'alber'],

'sample1' : [20.3, 25.3,3.1,3],

'sample2' : [130, 150,173,4],

'sample3' : [1.0, 2.0,12.0,4],

})

看起来像这样:

In [12]: df

Out[12]:

FavCol sample1 sample2 sample3

0 Fixy 20.3 130 1

1 Macky 25.3 150 2

2 querk 3.1 173 12

3 alber 3.0 4 4

我要做的是基于FavCol对数据帧进行排序(不区分大小写),但保持第一行Fixy不变.结果是:

FavCol sample1 sample2 sample3

Fixy 20.3 130 1

alber 3.0 4 4

Macky 25.3 150 2

querk 3.1 173 12

我该如何实现?

更新资料

我在复制[用户:John Galt]时遇到问题.

使用此数据:

Group No. Abbr. of test substance Route Time (hrs) Dose (/body) Conc. Volume of dosage (/body) # of mouse

1 PBS DMSO5% i.d. 6 0 mg 0 mg/ mL 0.1 mL 3

2 MPLA i.d. 6 0.01 mg 0.1 mg/ mL 0.1 mL 3

3 MALP2s i.d. 6 0.01 mg 0.1 mg/ mL 0.1 mL 3

4 R848 i.d. 6 0.1 mg 1 mg/ mL 0.1 mL 3

5 DMXAA i.d. 6 0.1 mg 1 mg/ mL 0.1 mL 3

这段代码:

import pandas as pd

df = pd.read_table("http://dpaste.com/0JPC984.txt")

colnames = df.columns.values.tolist()

print colnames

fixed_rown = colnames[1]

df['lower'] = df[fixed_rown].str.lower()

df.loc[1:] = df[1:].sort('lower')

df

它产生此:

Out[35]:

Group No. Abbr. of test substance Route Time (hrs) Dose (/body) \n0 1 PBS DMSO5% i.d. 6 0 mg

1 2 MPLA i.d. 6 0.01 mg

2 3 MALP2s i.d. 6 0.01 mg

3 4 R848 i.d. 6 0.1 mg

4 5 DMXAA i.d. 6 0.1 mg

Conc. Volume of dosage (/body) # of mouse lower

0 0 mg/ mL 0.1 mL 3 pbs dmso5%

1 0.1 mg/ mL 0.1 mL 3 mpla

2 0.1 mg/ mL 0.1 mL 3 malp2s

3 1 mg/ mL 0.1 mL 3 r848

4 1 mg/ mL 0.1 mL 3 dmxaa

In [45]: pd.__version__

Out[45]: '0.16.1'

固定pbs dmso5%之后,dmxaa没有出现.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值