merge函数实现比较file1和file2中的id，如果相等则把file2中id对应的名称写入文件1中指定的列

creme_de_menthe

已于 2024-07-29 15:11:19 修改

阅读量176

点赞数 3

分类专栏： python pandas 文章标签： python pandas

于 2024-07-29 15:02:35 首次发布

本文链接：https://blog.csdn.net/m0_51949690/article/details/140771554

版权

python 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

pandas

4 篇文章 0 订阅

订阅专栏

可以使用pandas库来实现这个任务。以下是一个示例代码，展示如何读取两个CSV文件，比较其中的ID列，并将文件2中ID对应的名称写入文件1中指定的列：

假设文件1和文件2的结构如下：

文件1（file1.csv）：

ID,Value,Name
1,10,
2,20,
3,30,

文件2（file2.csv）：

ID,Name
1,Alice
2,Bob
3,Charlie

示例代码：

import pandas as pd

# 读取文件1
file1 = pd.read_csv('path/to/your/file1.csv')

# 读取文件2
file2 = pd.read_csv('path/to/your/file2.csv')

# 合并两个DataFrame，基于ID列
merged = pd.merge(file1, file2[['ID', 'Name']], on='ID', how='left', suffixes=('', '_from_file2'))

# 如果文件1中已经有Name列并且你想更新它，可以使用以下方式：
merged['Name'] = merged['Name_from_file2']

# 删除临时的Name_from_file2列
merged = merged.drop(columns=['Name_from_file2'])

# 保存更新后的DataFrame到文件1
merged.to_csv('path/to/your/file1.csv', index=False)

解释：

pd.read_csv('path/to/your/file1.csv')：读取文件1并将其存储在DataFrame中。
pd.read_csv('path/to/your/file2.csv')：读取文件2并将其存储在DataFrame中。
pd.merge(file1, file2[['ID', 'Name']], on='ID', how='left', suffixes=('', '_from_file2'))：基于ID列合并两个DataFrame。使用how='left'确保所有文件1中的行都保留，并从文件2中获取匹配的Name列。
merged['Name'] = merged['Name_from_file2']：更新文件1中的Name列为文件2中的Name。
merged = merged.drop(columns=['Name_from_file2'])：删除临时的Name_from_file2列。
merged.to_csv('path/to/your/file1.csv', index=False)：将更新后的DataFrame保存回文件1。