pandas索引,分组计算

最新推荐文章于 2024-04-12 08:57:54 发布

zrx1236

最新推荐文章于 2024-04-12 08:57:54 发布

阅读量1.3k

点赞数 2

本文链接：https://blog.csdn.net/sinat_41901394/article/details/108240943

版权

这里写目录标题

索引
分组计算

索引

1.行索引

#看一个一维数组的索引
s=pd.Series(np.random.randn(5),index=list('abcde'))
s
s.index#Series的索引
s.index.name='zrx'#给索引赋一个名字
#查询pandas里预置的索引的类
pd.*index?

2.重复索引

#重复索引
s=pd.Series(np.arange(6),index=list('abcabe'))
s
s['a']
out[10]:
a    0
a    3
dtype: int32


s.index.is_unique#判断索引里面有无重复的
s.groupby(s.index).sum()#处理重复索引,把重复索引求和
s.groupby(s.index).mean()#处理重复索引,把重复索引求平均
s.groupby(s.index).first()#处理重复索引,把重复索引只取第一项

3.层次化索引

可以使数据在一个轴上有多个索引级别。即可以用二维的数据表达更高维度的数据，使数据组织方式更清晰。它使用 pd.MultiIndex 类来表示。
比如我们在分析股票数据，我们的一级行索引可以是日期；二级行索引可以是股票代码，列索引可以是股票的交易量，开盘价，收盘价等等。这样我们就可以把多个股票放在同一个时间维度下进行考察和分析。

#多级索引pd.MultiIndex
a = [['a', 'a', 'a', 'b', 'b', 'c', 'c'], [1, 2, 3, 1, 2, 2, 3]]
tuples = list(zip(*a))#把两个列表组装成一个，列表里的元素是元组
tuples
index=pd.MultiIndex.from_tuples(tuples,names=['level1','level2'])
index
s=pd.Series(np.random.randn(7),index=index)
s
#选取一级索引
s['b']

s['b',2]

dataframe 多层索引

df = pd.DataFrame(np.random.randint(

最低0.47元/天解锁文章

zrx1236

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
pandas索引,分组计算

这里写目录标题索引1.行索引2.重复索引3.层次化索引dataframe 多层索引交换索引索引列的转换分组计算1. 对Series进行分组2. 对DataFrame进行分组对分组进行迭代3.通过字典进行分组4.通过函数进行分组5.根据索引级别分组索引1.行索引#看一个一维数组的索引s=pd.Series(np.random.randn(5),index=list('abcde'))ss.index#Series的索引s.index.name='zrx'#给索引赋一个名字#查询pandas里预
复制链接

扫一扫