Pandas怎样实现Excel的vlookup并且在指定列后面输出?(二十二)

背景:
1、有两个excel,他们有相同的一个列;
2、按照这个列合并成一个大的excel,即vlookup功能,要求:

  • 只需要第二个excel的少量的列,比如从40个列中挑选2个列 ;
  • 新增的来自第二个excel的列需要放到第一个excel指定的列后面;

3、将结果输出到一个新的excel;

步骤1:读取两个数据表
import pandas as pd

# 学生成绩表
df_grade = pd.read_excel("./course_datas/c23_excel_vlookup/学生成绩表.xlsx") 
df_grade.head()

# 学生信息表
df_sinfo = pd.read_excel("./course_datas/c23_excel_vlookup/学生信息表.xlsx") 
df_sinfo.head()


目标:怎样将第二个“学生信息表”的姓名、性别两列,添加到第一个表“学生成绩表”,并且放在第一个表的“学号”列后面?

步骤2:实现两个表的关联(即excel的vloopup功能)
# 只筛选第二个表的少量的列
df_sinfo = df_sinfo[["学号", "姓名", "性别"]]
df_sinfo.head()

#默认内连接
df_merge = pd.merge(left=df_grade, right=df_sinfo, left_on="学号", right_on="学号")
df_merge.head()

步骤3:调整列的顺序
df_merge.columns #打印出dataframe的列名

问题:怎样将'姓名', '性别'两列,放到'学号'的后面? 接下来需要用Python的语法实现列表的处理

# 将columns变成python的列表形式
new_columns = df_merge.columns.to_list()
new_columns
# 按逆序insert,会将"姓名","性别"放到"学号"的后面
for name in ["姓名", "性别"][::-1]:
    new_columns.remove(name)
    new_columns.insert(new_columns.index("学号")+1, name)

df_merge = df_merge.reindex(columns=new_columns)
df_merge.head()
步骤4:输出最终的Excel文件
df_merge.to_excel("./course_datas/c23_excel_vlookup/合并后的数据表.xlsx", index=False)
  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值