python数据分析第8天 数据规整化:清理,转换,合并,重塑

合并数据集

pandas可以通过内置方式进行合并

pandas.merge  根据键不同  将DataFrame中的行连接起来

pandas.concat沿着 一条轴将多个对象堆叠到一起

实例方法  combine_first 可以将重复数据编接在一起


数据库风格的DataFrame合并

使用pd.merge函数, 使用on参数指定键

默认情况下,取交集。通过 how 设置 取并集


合并  索引会被丢弃




索引上的合并

传入left_index=True  或者   right_index=True     说明索引应该被用作连接键


对于层次化索引需要指明用做合并键的多个列


还支持join


轴向连接

默认情况下,concat 函数 在axis=0  上工作,产生一个Series    axis=1  产生DataFrame



合并重叠数据

可以使用np.where       相当于一种矢量化的if-else


对于DataFrame    combine_first 也会做同样的事情,可以看做打补丁



重塑和轴向旋转




????


将长格式  旋转 为 宽格式

对ldata 进行转换


前面两个参数 用作行和列索引的列名,最后一个参数则是用于填充DataFrame的数据列的列名

忽略最后一个参数,就会得到有层次化


数据转换
移除重复数据

duplicated方法返回一个布尔型Series,表示各行是否是重复行

而drop_duplicated  方法  移除重复行


利用函数或映射进行数据转换



替换值
























































  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值