DataFrame俗称数据框,和一般的Excel表格没有多大区别,一般包含索引(行)和表头(列),在python中,由pandas包提供。
这是一个最简单的数据框类型,只包含一级索引和一级表头
如果你的python还没有这个包,请执行以下命令安装:
pip install pandas
这一节,我们要处理的主题是:多级表头和多级目录
先看看他们长什么样子:
表格1:包含二级表头和一级索引
表格二:包含二级索引和一级表头
在Excel里面看这些表格,还没什么特别的感觉,但是,今天我们要在python中来处理这样的表格,下面就开始吧!先说一下内容大概:
1. 如何构造多级表格
多级表格,常来自于实际的需要,许多时候,我们的数据并不是单一的表现形式,会有对比、计算、时间序列等因素。我先给出两个一级表格(也就是我们数据的原始形式)。
日期 渠道 用户数 会话数 唯一身份浏览量
0 20180607 (Other) 3839 7324 15223
1 20180607 Direct 30060 35364 72330
2 20180607 Display 2 2 2
3 20180607 Organic Search 50636 57410 144043
4 20180607 Referral 2845 3370 8380
5 20180607 Social 1310 1564 3480
6 20180607 shareasale.com 214 238 568
日期 渠道 用户数 会话数 唯一身份浏览量
0 20180531 (Other) 3756 6351 13825
1 20180531 Direct 33195 38812 78479
2 20180531 Display 2 2 2
3 20180531 Email 1 1 3
4 20180531 Organic Search 56003 64026 158187
5 20180531 Referral 3185 3769 9252
6 20180531 Social 3380 3690 7698<