pandas层次索引应用-对广告点击率数据进行统计

最新推荐文章于 2023-10-02 15:17:12 发布

yctjin

最新推荐文章于 2023-10-02 15:17:12 发布

阅读量542

点赞数

分类专栏： python数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yctjin/article/details/79128225

版权

python数据分析专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.原始数据形式
hour id clicked
1 1 0
2 1 1
2 0
4 1

3 1 1

hour代表时间，id代表广告号，clicked代表是否被点击，1表示被点击了，下面将他转换成每个时刻，每个广告被点击了多少次.

2.获取两层索引值，也就是hour和id 索引值：

reindex = list(df1.index.levels[0]) #获取hour的索引值转成list--->[1,2,3]
recolumns = list(df1.index.levels[1])# 获取广告的索引值--->[1,2,4]

df1表示原始数据

3.创建一个全0的空df2，大小为时间长度*广告ID种类

df2 = pd.DataFrame(data = np.zeros((len(reindex),len(recolumns))),index = reindex,columns = recolumns)

4.进行统计

for t in reindex:
for i in df1.ix[t,:].index: ##此处获取当前时刻下有的id号
df2.ix[t,i] = df1.ix[t,i].sum() ## 利用sum函数进行统计1的数量
print(df4)

最终获得，如下形式，行代表广告id，列代表时间

1 2 4
1 0.0 0.0 0.0
2 1.0 0.0 1.0
3 1.0 0.0 0.0

ps:本人初学，记录下来为了方便以后查看。欢迎各位大佬提出更好的方法。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas层次索引应用-对广告点击率数据进行统计

1.原始数据形式 hour id clicked1 1 02 1 1 2 0 4 13 1 1hour代表时间，id代表广告号，clicked代表是否被点击，1表示被点击了，下面将他转换成每个时刻，每个
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。