python 比较list差异

本文介绍了如何使用Python进行列表的差异比较,包括取差集、交集和并集的方法,并提供了具体的操作示例。此外,还提及了如何比较两个文件夹的内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

1、取差集

2、取交集

3、取并集

比较两个文件夹


参考:python比较两个list之间的差异、相同(差集、交集、并集)_weixin_33736048的博客-CSDN博客

初始化数据

listA = ['zhangsan', 'lisi', 'wangwu']

listB = ['zhangsan', 'lisi', 'zhaoliu']

1、取差集


listA有,listB没有的:

set(listA).difference(set(listB))

set(['wangwu'])

1.2、listB对应listB的差集

set(listB).difference(set(listA))set(['zhaoliu'])

2、取交集

  1. set(listA).intersection(set(listB))

  2. set(['lisi', 'zhangsan'])

3、取并集

  1. set(listA).union(set(listB))

  2. -----

  3. set(['lisi', 'zhaoliu', 'zhangsan', 'wangwu'])

比较两个文件夹


if __name__ == '__main__':
    dir = r'D:\data'

    listA = glob.glob(dir + '/test/*')
    listB = glob.glob(dir + '/train/*')

    listA=[os.path.basename(patha) for patha in listA]
    listB=[os.path.basename(patha) for patha in listB]
    aaaa=set(listA).difference(set(listB))

    print(aaaa)
    print(aaaa)

Python中,比较两个列表的差异可以通过多种方法实现。以下是一些常见的方法: 1. **使用集合操作**: - 通过将列表转换为集合,然后使用集合的差集运算符`-`来找出两个列表之间的差异。 ```python list1 = [1, 2, 3, 4] list2 = [3, 4, 5, 6] diff_list1 = list(set(list1) - set(list2)) diff_list2 = list(set(list2) - set(list1)) print("List1 - List2:", diff_list1) print("List2 - List1:", diff_list2) ``` 2. **使用列表推导式**: - 通过列表推导式可以更直观地比较两个列表的元素。 ```python list1 = [1, 2, 3, 4] list2 = [3, 4, 5, 6] diff_list1 = [item for item in list1 if item not in list2] diff_list2 = [item for item in list2 if item not in list1] print("List1 - List2:", diff_list1) print("List2 - List1:", diff_list2) ``` 3. **使用`collections.Counter`**: - `Counter`可以帮助统计每个元素的出现次数,从而找出两个列表中元素数量的差异。 ```python from collections import Counter list1 = [1, 2, 3, 4] list2 = [3, 4, 5, 6] counter1 = Counter(list1) counter2 = Counter(list2) diff_counter = counter1 - counter2 diff_list1 = list(diff_counter.elements()) diff_counter = counter2 - counter1 diff_list2 = list(diff_counter.elements()) print("List1 - List2:", diff_list1) print("List2 - List1:", diff_list2) ``` 4. **使用第三方库如`pandas`**: - 如果处理的数据量较大,可以考虑使用`pandas`库进行高效的数据处理。 ```python import pandas as pd list1 = [1, 2, 3, 4] list2 = [3, 4, 5, 6] df1 = pd.DataFrame(list1, columns=['values']) df2 = pd.DataFrame(list2, columns=['values']) diff_df = df1[~df1['values'].isin(df2['values'])] print("List1 - List2:", diff_df['values'].tolist()) ``` 这些方法各有优缺点,可以根据具体的需求和数据规模选择合适的方法。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值