pandas数据重构与数据转换

pandas数据重构与数据转换

重构
import numpy as np
import pandas as pd

df_obj = pd.DataFrame(np.random.randint(0,10, (5,2)), columns=['data1', 'data2'])
df_obj

运行结果:
在这里插入图片描述

  • stack

    • 将列索引旋转为行索引,完成层级索引

      stacked = df_obj.stack()
      print(stacked)
      

      运行结果:
      在这里插入图片描述

    • dataframe 转换为 series

      print(type(stacked))
      print(type(stacked.index))
      

      运行结果:
      在这里插入图片描述

  • unstack

    • 将层级索引展开

    • series转化为dataframe

    • 默认操作内层索引

      # 默认操作内层索引
      stacked.unstack()
      

      运行结果:
      在这里插入图片描述

# 通过level指定操作索引的级别
stacked.unstack(level=0)

运行结果:
在这里插入图片描述

转换
import numpy as np
import pandas as pd

df_obj = pd.DataFrame({'data1' : ['a'] * 4 + ['b'] * 4,
                       'data2' : np.random.randint(0, 4, 8)})
df_obj

运行结果:
在这里插入图片描述

  • 处理重复数据

    • duplicated() 返回布尔型series表示每行是否为重复行

      df_obj.duplicated()
      

      运行结果:
      在这里插入图片描述

    • drop_duplicates()过滤重复行

      • 默认判断全部列

        df_obj.drop_duplicates()
        

        运行结果:
        在这里插入图片描述

      • 可指定按某些列判断

        df_obj.drop_duplicates('data2')
        

        运行结果:
        在这里插入图片描述

  • map

    ser_obj = pd.Series(np.random.randint(0,10,10))
    ser_obj
    

    运行结果:
    在这里插入图片描述

    • series根据map传入的函数对每行或每列进行转换

      ser_obj.map(lambda x : x ** 2)
      

      运行结果:
      在这里插入图片描述

  • 数据替换 replace

    # 替换单个值
    ser_obj.replace(0, -100)
    

    运行结果:
    在这里插入图片描述

    # 替换多个值
    ser_obj.replace([0, 2], [-100, -200])
    

    运行结果:
    在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Sweeney Chen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值