pandas处理Excel数据

我们在日常工作中,经常会碰到处理Excel表中数据的情况,例如学校的教师需要统计学生的成绩或者学生信息的管理。如果使用人工的方式进行修改,数据量很大的时候处理起来速度会很慢,还容易出现错行等错误。此时,如果我们使用pandas进行数据的处理,速度会很快且不易出错。

接下来就以一个简单的例子来说明。

需求

学校教师手中有两张学生表,但是只有一张表中有学生的电话信息(图中手机号为随机生成的)
在这里插入图片描述
需要将此表中的电话信息填入另一个表中。
在这里插入图片描述
从图中可以看到,两张表的结构完全不同,学生姓名的排列顺序也不同。
如果采用人工录入的方式,只能一条一条复制粘贴,效率非常低。
此时我们可以使用pandas进行数据处理,将表1中的手机号数据填入表2中的指定位置中。

思路

解决这个需求的思路其实很简单:

  1. 分别提取两张表中我们需要使用到的字段
  2. 建立两张表的连接,获得准备填入的数据
  3. 将数据填入表2的指定位置

代码

import pandas as pd
  1. 读两张表的数据,进行预处理
data1 = pd.read_excel('./1-name-phone-number.xlsx', header=None)
# 自定义函数,格式化处理姓名中可能出现的特殊字符
def func(
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值