数据分析入门——数据预处理

合并数据

1、横向与纵向堆叠
按照行名称进行合并
在这里插入图片描述
函数:pandas.concat
在这里插入图片描述
在这里插入图片描述2、纵向堆叠append
append要求所有列必须一致才可以使用
在这里插入图片描述
在这里插入图片描述
3、主键合并merge函数
在这里插入图片描述

pd.merge(order,data,left_on='info_id',right_on='order_id')

2、主键合并join方法
在这里插入图片描述
s

data.join(order,,on='order_id',rsuffix='1')
#右合并

2、重叠合并数据combing_first
pandas.dateframe.combine_first(other)

清洗数据

1、重复值处理
在这里插入图片描述
其不仅支持单一特征去重,还可支持各个特征的去重
data.drop_duplicates(subset=[‘order_id’,‘emp_id’]
2、特征重复
在这里插入图片描述判断类型特征重复

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值