pandas层次索引应用-对广告点击率数据进行统计

1.原始数据形式          
hour id clicked
1       1         0
2       1         1
         2         0
         4         1

3       1         1

hour代表时间,id代表广告号,clicked代表是否被点击,1表示被点击了,下面将他转换成每个时刻,每个广告被点击了多少次.

2.获取两层索引值,也就是hour和id 索引值:

reindex = list(df1.index.levels[0]) #获取hour的索引值 转成list--->[1,2,3]
recolumns = list(df1.index.levels[1])# 获取广告的索引值--->[1,2,4]

df1表示原始数据

3.创建一个全0的空df2,大小为 时间长度*广告ID种类

df2 = pd.DataFrame(data = np.zeros((len(reindex),len(recolumns))),index = reindex,columns = recolumns)

4.进行统计

for t in reindex:
    for i in df1.ix[t,:].index: ##此处获取当前时刻下有的id号
        df2.ix[t,i] = df1.ix[t,i].sum() ## 利用sum函数进行统计1的数量
print(df4)

最终获得,如下形式,行代表广告id,列代表时间

     1    2    4
1  0.0  0.0  0.0
2  1.0  0.0  1.0
3  1.0  0.0  0.0

ps:本人初学,记录下来为了方便以后查看。欢迎各位大佬提出更好的方法。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
编译原理是计算机专业的一门核心课程,旨在介绍编译程序构造的一般原理和基本方法。编译原理不仅是计算机科学理论的重要组成部分,也是实现高效、可靠的计算机程序设计的关键。本文将对编译原理的基本概念、发展历程、主要内容和实际应用进行详细介绍编译原理是计算机专业的一门核心课程,旨在介绍编译程序构造的一般原理和基本方法。编译原理不仅是计算机科学理论的重要组成部分,也是实现高效、可靠的计算机程序设计的关键。本文将对编译原理的基本概念、发展历程、主要内容和实际应用进行详细介绍编译原理是计算机专业的一门核心课程,旨在介绍编译程序构造的一般原理和基本方法。编译原理不仅是计算机科学理论的重要组成部分,也是实现高效、可靠的计算机程序设计的关键。本文将对编译原理的基本概念、发展历程、主要内容和实际应用进行详细介绍编译原理是计算机专业的一门核心课程,旨在介绍编译程序构造的一般原理和基本方法。编译原理不仅是计算机科学理论的重要组成部分,也是实现高效、可靠的计算机程序设计的关键。本文将对编译原理的基本概念、发展历程、主要内容和实际应用进行详细介绍编译原理是计算机专业的一门核心课程,旨在介绍编译程序构造的一般原理和基本

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值