Pandas怎样实现Excel的vlookup并且在指定列后面输出？（二十二）

最新推荐文章于 2024-03-08 15:20:11 发布

梦捷者

最新推荐文章于 2024-03-08 15:20:11 发布

阅读量1.3k

点赞数 1

分类专栏： Pandas使用

本文链接：https://blog.csdn.net/qq_41706810/article/details/105972409

版权

Pandas使用专栏收录该内容

38 篇文章 12 订阅

订阅专栏

背景：
1、有两个excel，他们有相同的一个列；
2、按照这个列合并成一个大的excel，即vlookup功能，要求：

只需要第二个excel的少量的列，比如从40个列中挑选2个列；
新增的来自第二个excel的列需要放到第一个excel指定的列后面；

3、将结果输出到一个新的excel;

步骤1：读取两个数据表

import pandas as pd

# 学生成绩表
df_grade = pd.read_excel("./course_datas/c23_excel_vlookup/学生成绩表.xlsx") 
df_grade.head()

# 学生信息表
df_sinfo = pd.read_excel("./course_datas/c23_excel_vlookup/学生信息表.xlsx") 
df_sinfo.head()

目标：怎样将第二个“学生信息表”的姓名、性别两列，添加到第一个表“学生成绩表”，并且放在第一个表的“学号”列后面？

步骤2：实现两个表的关联（即excel的vloopup功能）

# 只筛选第二个表的少量的列
df_sinfo = df_sinfo[["学号", "姓名", "性别"]]
df_sinfo.head()

#默认内连接
df_merge = pd.merge(left=df_grade, right=df_sinfo, left_on="学号", right_on="学号")
df_merge.head()

步骤3：调整列的顺序

df_merge.columns #打印出dataframe的列名

问题：怎样将'姓名', '性别'两列，放到'学号'的后面？接下来需要用Python的语法实现列表的处理

# 将columns变成python的列表形式
new_columns = df_merge.columns.to_list()
new_columns
# 按逆序insert，会将"姓名"，"性别"放到"学号"的后面
for name in ["姓名", "性别"][::-1]:
    new_columns.remove(name)
    new_columns.insert(new_columns.index("学号")+1, name)

df_merge = df_merge.reindex(columns=new_columns)
df_merge.head()

步骤4：输出最终的Excel文件

df_merge.to_excel("./course_datas/c23_excel_vlookup/合并后的数据表.xlsx", index=False)

梦捷者

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
Pandas怎样实现Excel的vlookup并且在指定列后面输出？（二十二）

背景：1、有两个excel，他们有相同的一个列；2、按照这个列合并成一个大的excel，即vlookup功能，要求：只需要第二个excel的少量的列，比如从40个列中挑选2个列；新增的来自第二个excel的列需要放到第一个excel指定的列后面；3、将结果输出到一个新的excel;步骤1：读取两个数据表import pandas as pd# 学生成绩表df_grade ...
复制链接

扫一扫