joyful pandas task3-索引

(1)loc索引
1.选择多行
df_demo.loc[[‘Qiang Sun’,‘Quan Zhao’], [‘School’,‘Gender’]]
df_demo.loc[‘Gaojuan You’:‘Gaoqiang Qian’, ‘School’:‘Gender’]
2.条件筛选
df_demo.loc[df_demo.Weight>70].head()
df_demo.loc[condition_1 | condition_2]
3.前面所提到的传入元素列表,也可以通过isin方法返回的布尔列表等价写出,例如选出所有大一和大四的同学信息:
df_demo.loc[df_demo.Grade.isin([‘Freshman’, ‘Senior’])].head()
4.此外,还支持使用lambda表达式,其返回值也同样必须是先前提到的四种形式之一:
df_demo.loc[lambda x:‘Quan Zhao’, lambda x:‘Gender’]
5.由于函数无法返回如start: end: step的切片形式,故返回切片时要用slice对象进行包装:
df_demo.loc[lambda x: slice(‘Gaojuan You’, ‘Gaoqiang Qian’)]

(2)iloc索引
1.选择多行
df_demo.iloc[[0, 1], [0, 1]] # 前两行前两列
df_demo.iloc[1: 4, 2:4] # 切片不包含结束端点
2.条件筛选
df_demo.iloc[(df_demo.Weight>80).values].head()
3.lambda表达式
df_demo.iloc[lambda x: slice(1, 4)] # 传入切片为返回值的函数

(3)多级索引
1.索引的名字和值属性分别可以通过names和values获得
df_multi.index.names
df_multi.columns.names
df_multi.index.values
df_multi.columns.values
如果想要得到某一层的索引,则需要通过get_level_values获得:
df_multi.index.get_level_values(0)
2.loc索引
类似上文:
df_multi.loc[[(‘Fudan University’, ‘Senior’), (‘Shanghai Jiao Tong University’, ‘Freshman’)]].head()
3.IndexSlice对象
需要先定义:idx = pd.IndexSlice
df_ex.loc[idx[:‘A’, ‘b’:], idx[‘E’:, ‘e’:]]
df_ex.loc[idx[:‘A’, lambda x:x.sum()>0]] # 列和大于0

(4)索引运算
1.由于集合的元素是互异的,但是索引中可能有相同的元素,先用unique去重后再进行运算。
2.若两张表需要做集合运算的列并没有被设置索引,一种办法是先转成索引,运算后再恢复,另一种方法是利用isin函数,例如在重置索引的第一张表中选出id列交集的所在行:

df_set_in_col_1 = df_set_1.reset_index()
df_set_in_col_2 = df_set_2.reset_index()
df_set_in_col_1[df_set_in_col_1.id1.isin(df_set_in_col_2.id2)]

转:joyful pandas

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值