excel处理_去重_姓名电话匹配

去重

代理商姓名手机对照表整合 格式如下
在这里插入图片描述
表里有很多重复电话姓名对照,在这里去重

import os
import pandas as pd
import shutil

dianhua = pd.read_excel('代理商姓名手机对照表整合.xlsx', )
dianhua.drop_duplicates('手机号', 'first', inplace=True)  # 去重

with pd.ExcelWriter('./分销商电话去重.xlsx') as writer:
    dianhua.to_excel(writer, sheet_name='Sheet1', index=False)

print('Pycharm')

电话姓名匹配

代理分销订单表 格式如下

在这里插入图片描述

根据分销商姓名电话对照表 把推荐账号 改成 推荐人
1、换表头
2、两表拼接 merge

import os
import pandas as pd
import shutil

dianhua = pd.read_excel('分销商电话去重.xlsx', )

# fenxiao = pd.read_excel('代理分销订单表2.xlsx', usecols=[0, 1, 2, 3, 4])
fenxiao = pd.read_excel('代理分销订单表.xlsx')
c_list = fenxiao.values.tolist()[0]  # 得到想要设置为列索引【表头】的某一行提取出来
fenxiao.columns = c_list  		    # 设置列索引【表头】
fenxiao.drop(index = [0],inplace = True)
fenxiao['手机号'] = fenxiao['手机号'].apply(pd.to_numeric)  #  分销表里  手机号 是str格式

c = pd.merge(fenxiao,dianhua,on='手机号',how='left')  

with pd.ExcelWriter('./分销商电话姓名匹配结果.xlsx') as writer:
    c.to_excel(writer, sheet_name='Sheet1', index=False)

print('Pycharm')

关于merge函数
(1)使用主键和不使用主键
(2)连接方式:inner(内连接)、outer(外连接)、left(左连接)、right(右连接)
1、inner:主键信息相同,则拼接。只保留主键相同的信息
2、outer:外连接是保留两个表的所有信息,拼接的时候遇到标签不能对齐的部分,用NAN进行填充
3、left:左连接是保留所有左表的信息,把右表中主键与左表一致的信息拼接进来,标签不能对齐的部分,用NAN进行填充
4、right:右连接是保留所有右表的信息,把坐表中主键与右表一致的信息拼接进来,标签不能对齐的部分,用NAN进行填充
(3)参数lefton和righton,可以用于分别指定每个表的主键。相同列但是列名不同,如A表是 姓名,B表是 员工姓名

  • 7
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

叶叶梓梓

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值