23.03.26pandas合并,索引,分组和聚合

  • 把字符串离散化:
    1)获取字符串的去重后列表
    2)构造全为0的数组,columns为字符串的列表
    3)给全为0的数组赋值,遍历

  • join:index相同的数据合并到一起
    在这里插入图片描述
    3 merge:按照指定的列把数据按照一定的方式合并到一起
    在这里插入图片描述
    4.分组聚合:

  • 1)df.groupby(by=“”) 得到group对象,能够用于聚合和遍历

  • 2)df.groupby(by=“”).mean()

    1. df.groupby(by=“”).mean()
    1. df.groupby(by=[“”,“”]).count(): 带复合索引的DataFrame

5.索引:

  • df.index()
  • df.index=[“a”, “c”] 设定索引的值
  • df.set_index(“a”) 设定某一列为索引
  • df.set_index([“a”,“c”]) 设定某两列为索引
  • 从复合索引中取值:
    Series: s1[“a”][“b”] 或者 s1[“a”,“b”]
    DataFrame: df.loc[“a”].loc[“b”]
  • 从里层索引开始选择:df.swaplevel() 交换里外层索引的位置
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值