python_透视表操作unstack

最新推荐文章于 2024-05-09 04:51:18 发布

炼丹师666

最新推荐文章于 2024-05-09 04:51:18 发布

阅读量235

点赞数

分类专栏： Python pandas

本文链接：https://blog.csdn.net/wj1298250240/article/details/103284332

版权

Python 同时被 2 个专栏收录

123 篇文章 1 订阅

订阅专栏

pandas

38 篇文章 2 订阅

订阅专栏

python_透视表操作

Data Wrangling: Join, Combine,¶
# 第8章 数据规整：聚合、合并和重塑
# 在许多应⽤中，数据可能分散在许多⽂件或数据库中，存储的形
# 式也不利于分析。本章关注可以聚合、合并、重塑数据的⽅法。
import numpy as np
import pandas as pd
pd.options.display.max_rows = 20
np.random.seed(12345)
import matplotlib.pyplot as plt
plt.rc('figure', figsize=(10, 6))
np.set_printoptions(precision=4, suppress=True)
Hierarchical Indexing
8.1 层次化索引
# 层次化索引（hierarchical indexing）是pandas的⼀项重要功
# 能，它使你能在⼀个轴上拥有多个（两个以上）索引级别。抽象
# 点说，它使你能以低维度形式处理⾼维度数据。
# 8.1 层次化索引
# 层次化索引（hierarchical indexing）是pandas的⼀项重要功
# 能，它使你能在⼀个轴上拥有多个（两个以上）索引级别。抽象
# 点说，它使你能以低维度形式处理⾼维度数据。
data = pd.Series(np.random.randn(9),
                 index=[['a', 'a', 'a', 'b', 'b', 'c', 'c', 'd', 'd'],
                        [1, 2, 3, 1, 3, 1, 2, 2, 3]])
data
a  1   -0.204708
   2    0.478943
   3   -0.519439
b  1   -0.555730
   3    1.965781
c  1    1.393406
   2    0.092908
d  2    0.281746
   3    0.769023
dtype: float64
data.index
MultiIndex(levels=[['a', 'b', 'c', 'd'], [1, 2, 3]],
           labels=[[0, 0, 0, 1, 1, 2, 2, 3, 3], [0, 1, 2, 0, 2, 0, 1, 1, 2]])
data['b']
data['b':'c']
data.loc[['b', 'd']]
data.loc[:, 2]
# 层次化索引在数据重塑和基于分组的操作（如透视表⽣成）中扮
# 演着重要的⻆⾊。例如，可以通过unstack⽅法将这段数据重新
# 安排到⼀个DataFrame中：
data.unstack()
1	2	3
a	-0.204708	0.478943	-0.519439
b	-0.555730	NaN	1.965781
c	1.393406	0.092908	NaN
d	NaN	0.281746	0.769023
#
#unstack的逆运算是stack：
data.unstack().stack()
a  1   -0.204708
   2    0.478943
   3   -0.519439
b  1   -0.555730
   3    1.965781
c  1    1.393406
   2    0.092908
d  2    0.281746
   3    0.769023
dtype: float64
frame = pd.DataFrame(np.arange(12).reshape((4, 3)),
                     index=[['a', 'a', 'b', 'b'], [1, 2, 1, 2]],
                     columns=[['Ohio', 'Ohio', 'Colorado'],
                              ['Green', 'Red', 'Green']])
frame
frame.index.names = ['key1', 'key2']
frame.columns.names = ['state', 'color']
frame
frame['Ohio']
MultiIndex.from_arrays([['Ohio', 'Ohio', 'Colorado'], ['Green', 'Red', 'Green']], names=['state', 'color'])

炼丹师666

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python_透视表操作unstack

python_透视表操作Data Wrangling: Join, Combine,¶# 第8章数据规整：聚合、合并和重塑# 在许多应⽤中，数据可能分散在许多⽂件或数据库中，存储的形# 式也不利于分析。本章关注可以聚合、合并、重塑数据的⽅法。import numpy as npimport pandas as pdpd.options.display.max_rows = 20n...
复制链接

扫一扫

专栏目录