利用python进行数据分析(第八章)

数据规整:连接、联合与重塑

分层索引

  • 简介
  1. 一个轴向上拥有多个索引层级
  2. 是在更低维度的形式中处理更高维度数据的方式
  3. 在重塑数据和数组透视表等分组操作中有重要作用
  4. unstack 重新排列df
  5. stack 反操作
  6. 每个轴都可以有分层索引
  7. 分层的层级可以有名称
  • 重排列和层级排列
  1. sort_index只能在单个层级上对数据进行排序
  2. sort_index可使得结果按照层级进行字典排序 level=0从最外层进行排序
  • 按层级进行汇总统计
  1. df.sum(level='', axis= ) 使用了groupby机制
  • 使用DataFrame的列进行索引
  1. set_index 将多列或一列作为行索引
  2. reset_index 反操作 分层索引的索引层级被移动到列中

联合与合并数据集

merge、concat、combine_first等

  • 数据库风格的DataFrame连接
  1. 关系数据库核心:合并或连接操作通过一个或多个键连接行来联合数据集
  2. merge函数 主要用于将各种join操作运算运用在数据上
  3. on 指定连接键 没指定的话,默认将重叠列名作为连接键,若列名都不同,可left_on right_on
  4. how 指定连接方式 默认内连接inner 交集 可指定outer 外连接 并集 left 保留左表 right保留右表
  5. suffixes 重复列名后缀
  • 根据索引合并
  1. merge方法 right
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值