pandas reindex_Pandas 必备操作之 Index

最新推荐文章于 2024-09-05 17:54:35 发布

weixin_39563420

最新推荐文章于 2024-09-05 17:54:35 发布

阅读量235

点赞数

文章标签： pandas reindex

1 index

pandas 中的 index 是行索引或行标签。行标签可以说是 pandas 的灵魂一签，支撑了 pandas 很多强大的业务功能，比如多个数据框的 join, merge 操作，自动对齐等。

下面总结几个平时常用的关于 index 的操作

2 列转 index

有时，我们想把现有的数据框的某些列转化为 index，为之后的更多操作做准备。列转 index 实现方法如下：

In [1]: import pandas as pd

In [2]: df1 = pd.DataFrame({'a':[1,3,5],'b':[9,4,12]})

In [3]: df1

Out[3]:

a b

0 1 9

1 3 4

2 5 12

In [4]: df1.set_index('a',drop=False)

Out[4]:

a b

a

1 1 9

3 3 4

5 5 12

In [5]: df1.set_index('a',drop=True)

Out[5]:

b

a

1 9

3 4

5 12

3 index 转列

操作完成后，想再还原，即 index 转化为列，操作如下：

In [9]: df2.reset_index('a',drop=True)

Out[9]:

b

0 9

1 4

2 12

In [10]: df2.reset_index('a',drop=False)

Out[10]:

a b

0 1 9

1 3 4

2 5 12

4 index, 随心所欲

如果想按照某种规则，重新排序行数据或列数据，靠一个函数就可以做到，它就是 reindex, 设置一个

In [3]: df1

Out[3]:

a b

0 1 9

1 3 4

2 5 12

In [12]: df1.reindex([0,3,2,1])

Out[12]:

a b

0 1.0 9.0

3 NaN NaN

2 5.0 12.0

1 3.0 4.0

df1 原来有的行索引会重新按照最新的索引[0,3,2,1]重新对齐，原来没有的行索引 3，默认数据都填充为 NaN.

列数据的调整，也一样通过 reindex 实现，如下：

In [13]: df1.reindex(columns=['b','a','c'])

Out[13]:

b a c

0 9 1 NaN

1 4 3 NaN

2 12 5 NaN

以上是关于 index 调整的某些策略。

5 留一个问题

如何判断一个数据框中某行数据等于某个Series，比如：

In [19]: df

Out[19]:

a b

0 1 6

1 2 2

2 5 8

s = pd.Series([5,8],index=['a','b']) # df的 index=2 等于s, 所以为 True

s1 = pd.Series([89,8],index=['a','b']) # False

欢迎留言，期待你的想法。

Python 数据分析必备学习路线：期待你的参与

Python异常：unhashable type 是怎么回事？

Python与机器学习算法频道

长按订阅，干货满满

weixin_39563420

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。