【python】对比excel文件某一列数据

python对比excel某一列数据

  • 使用场景
  • 场景:
    用于对比表格1和表格2 某一列中存在不同的数据。
    举例:
    表格a :有司机1和2
    表格b :有司机2和3
    工具执行后返回 司机 1和3

使用方法:【备注:暂时只支持xlsx格式】
1、将两个表格导入工具目录下
2、执行py文件,输入第一个文件名,如“filename.xlsx”
3、回车后,继续输入第二个文件名
4、回车后,输入需要比较的那一列数据的titlename,如“司机姓名”

__author__ = 'dxj'
data = "2022/1/24 11:05"
from openpyxl import load_workbook

from openpyxl.utils.exceptions import InvalidFileException

class ReadExcel:     # 读取Excel里面的内容

    def __init__(self, file_name, sheet_name):
        self.file_name = file_name
        self.sheet_name = sheet_name

    def get_title(self):     # 读取Excel里面的title数据
        wb = load_workbook(self.file_name)     # 打开Excel工作簿
        sheet1 = wb[self.sheet_name]
        title = []               # 定义一个空列表,将读取的title字段进行存储
        for i in range(1, sheet1.max_column+1):
            title.append(sheet1.cell(1, i).<
  • 2
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 很高兴为您服务!这里是Python代码的示例,它可以实现您的需求:import pandas as pd# 加载文件 df1 = pd.read_excel('a.xlsx') df2 = pd.read_excel('b.xlsx')# 选择要比较的列 col1 = df1['某一列'] col2 = df2['某一列']# 删除相同数据 df1.drop(df1[col1.isin(col2)].index,inplace=True)# 保存新文件 df1.to_excel('new_a.xlsx') ### 回答2: 可以使用Python的pandas库来实现这个需求。下面是一个简单的程序示例: ```python import pandas as pd # 读取两个Excel文件数据 df_a = pd.read_excel('file_a.xlsx') df_b = pd.read_excel('file_b.xlsx') # 指定需要对比的列 column_a = '列名A' column_b = '列名B' # 根据列数据对比删除相同行 df_merged = df_a[~df_a[column_a].isin(df_b[column_b])] # 将新数据另存为Excel文件 df_merged.to_excel('file_merged.xlsx', index=False) ``` 请将代码中的`file_a.xlsx`和`file_b.xlsx`替换为实际的文件路径,同时将`列名A`和`列名B`替换为需要对比的列名。 此程序会读取两个Excel文件数据,并通过指定列数据对比删除相同行,最后将新数据另存为一个新的Excel文件“file_merged.xlsx”。 ### 回答3: 下面是一个使用Python的示例程序,可用于将两个Excel文件数据进行比较并删除相同数据行后保存为新文件。 ``` import pandas as pd # 读取两个Excel文件数据 df_a = pd.read_excel('a文件路径.xlsx') df_b = pd.read_excel('b文件路径.xlsx') # 指定待对比的列 compare_col_a = '待对比的列名A' compare_col_b = '待对比的列名B' # 将相同数据的行删除 df_result = df_a[~df_a[compare_col_a].isin(df_b[compare_col_b])] # 保存结果到新文件 df_result.to_excel('结果文件路径.xlsx', index=False) ``` 请将上述代码中的`a文件路径.xlsx`、`b文件路径.xlsx`以及`结果文件路径.xlsx`替换为你具体的文件路径。 此程序使用了Pandas库来处理Excel文件,首先读取了两个文件数据,然后根据指定的待对比的列名A和列名B,在DataFrame中使用`isin()`方法来找出不在B文件中的A文件数据行。最后,结果保存到一个新的Excel文件中。 请确保你已经安装了Pandas库。可以使用以下命令来安装:`pip install pandas`。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值