Python之Pandas库（2）——基本功能（上）

最新推荐文章于 2023-09-10 21:46:19 发布

Chrishany

最新推荐文章于 2023-09-10 21:46:19 发布

阅读量237

点赞数

分类专栏： pandas Python

本文链接：https://blog.csdn.net/sinat_42574069/article/details/104089397

版权

本博客为《利用Python进行数据分析》的读书笔记，请勿转载用于其他商业用途。

1、重建索引

reindex是Pandas对象的重要方法，该方法用于创建一个符合新索引的新对象。例：

obj = pd.Series([4.5, 7.2, -5.3, 3.6], index=['d', 'b', 'a', 'c'])
print(obj)

#
d    4.5
b    7.2
a   -5.3
c    3.6
dtype: float64

Series调用reindex方法时，会将数据按照新的索引进行排列，如果某个索引值之前并不存在，则会引入缺失值：

obj2 = obj.reindex(['a', 'b', 'c', 'd', 'e'])
print(obj2)

#
a   -5.3
b    7.2
c    3.6
d    4.5
e    NaN
dtype: float64

对于顺序数据，比如时间序列，在重建索引时可能会需要进行插值或填值。method可选参数允许我们使用诸如ffill等方法在重建索引时插值，ffill方法会将值前向填充：

obj3= pd.Series(['blue', 'purple', 'yellow'], index=[0, 2, 4])
print(obj3)

obj3 = obj3.reindex(range(6), method='ffill')
print(obj3)

#
0      blue
2    purple
4    yellow
dtype: object

0      blue
1      blue
2    purple
3    purple
4    yellow
5    yellow
dtype: object

在DataFrame中，reindex可以改变行索引、列索引，也可以同时改变二者。当仅传入一个序列时，结果中的行会重建索引：

frame = pd.DataFrame(np.arange(9).reshape((3, 3)), index=['a', 'c', 'd'], columns=['Ohio', 'Texas', 'California'])
print(frame)

frame2 = frame.reindex(['a', 'b', 'c', 'd'])
print(frame2)

#
   Ohio  Texas  California
a     0      1           2
c     3      4           5
d     6      7           8

   Ohio  Texas  California
a   0.0    1.0         2.0
b   NaN    NaN         NaN
c   3.0    4.0         5.0
d   6.0    7.0         8.0

列可以使用columns关键字重建索引：

states = ['Texas', 'Utah', 'California']
frame3 = frame.reindex(columns = states)
print(frame3)

#

最低0.47元/天解锁文章

Chrishany

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python之Pandas库（2）——基本功能（上）

本博客为《利用Python进行数据分析》的读书笔记，请勿转载用于其他商业用途。1、重建索引reindex是Pandas对象的重要方法，该方法用于创建一个符合新索引的新对象。例：obj = pd.Series([4.5, 7.2, -5.3, 3.6], index=['d', 'b', 'a', 'c'])print(obj)#d 4.5b 7.2a ...
复制链接

扫一扫

专栏目录