如何查找两个列表之间的差异?

点击上方 IT牧场 ,选择 置顶或者星标

技术干货每日送达!

1. 概述

查找相同数据类型的对象集合之间的差异是一项常见的编程任务。举个例子,假设我们有一份申请考试的学生名单和另一份通过考试的学生名单。这两张名单的区别会告诉我们那些没有通过考试的学生。

Java中,List API 中没有显式的方法来查找两个列表之间的差异,尽管有一些helper方法非常接近。

在本篇文章中,我们将了解如何找出两个列表之间的差异。我们将尝试几种不同的方法,包括普通的Java(有和没有Streams),以及使用第三方库,如GuavaApache Commons Collections

2. 测试设置

首先定义两个列表,我们将用它们来测试示例:

public class FindDifferencesBetweenListsUnitTest {
 
    private static final List listOne = Arrays.asList("Jack", "Tom", "Sam", "John", "James", "Jack");
    private static final List listTwo = Arrays.asList("Jack", "Daniel", "Sam", "Alan", "James", "George");
 
}

3. 使用 Java List API

我们可以创建一个列表的副本,然后使用List 的方法removeAll() ,删除与另一个相同的所有元素:

List<String> differences = new ArrayList<>(listOne);
differences.removeAll(listTwo);
assertEquals(2, differences.size());
assertThat(differences).containsExactly("Tom", "John");

让我们把这个颠倒过来,从另一个角度找出差异:

List<String> differences = new ArrayList<>(listTwo);
differences.removeAll(listOne);
assertEquals(3, differences.size());
assertThat(differences).containsExactly("Daniel", "Alan", "George");

我们还应该注意到,如果我们想找到两个列表之间的公共元素,List 还有一个 retainal 方法。

4. 使用 Streams API

Java Stream API 可用于对集合中的数据执行顺序操作,包括过滤列表之间的差异

List<String> differences = listOne.stream()
            .filter(element -> !listTwo.contains(element))
            .collect(Collectors.toList());
assertEquals(2, differences.size());
assertThat(differences).containsExactly("Tom", "John");

与第一个示例一样,我们可以切换列表的顺序,以从第二个列表中找到不同的元素:

List<String> differences = listTwo.stream()
            .filter(element -> !listOne.contains(element))
            .collect(Collectors.toList());
assertEquals(3, differences.size());
assertThat(differences).containsExactly("Daniel", "Alan", "George");

注意 List.contains() 对于较大的列表来说,可能是一项成本高昂的操作。

5. 使用第三方库

5.1. 使用Google Guava

Guava 包含 Sets.difference 方法, 但要使用它,我们需要先将列表转换为集合:

List<String> differences = new ArrayList<>(Sets.difference(Sets.newHashSet(listOne), Sets.newHashSet(listTwo)));
assertEquals(2, differences.size());
assertThat(differences).containsExactlyInAnyOrder("Tom", "John");

注意,将 列表 转换为 集合 会产生重复数据消除和重新排序的效果。

5.2. 使用 Apache Commons Collections

Apache Commons Collections中的 CollectionUtils 包含 removeAll 方法.

该方法类似于List.removeAll(),同时也为结果创建一个新的集合:

List<String> differences = new ArrayList<>((CollectionUtils.removeAll(listOne, listTwo)));
assertEquals(2, differences.size());
assertThat(differences).containsExactly("Tom", "John");

6. 处理重复值

现在让我们看看当两个列表包含重复值时的差异。

为了实现这一点,我们需要从第一个列表中删除重复的元素,精确到它们包含在第二个列表中的次数

在我们的示例中,“Jack”值在第一个列表中出现两次,在第二个列表中仅出现一次:

List<String> differences = new ArrayList<>(listOne);
listTwo.forEach(differences::remove);
assertThat(differences).containsExactly("Tom", "John", "Jack");

我们也可以使用Apache Commons Collections中的subtract方法来实现:

List<String> differences = new ArrayList<>(CollectionUtils.subtract(listOne, listTwo));
assertEquals(3, differences.size());
assertThat(differences).containsExactly("Tom", "John", "Jack");

7. 结论

在本文中,我们探讨了几种查找列表之间差异的方法

在这些示例中,我们介绍了一个基本的Java解决方案,一个使用StreamsAPI的解决方案,以及Google Guava和Apache Commons Collections等第三方库,以及了解了如何处理重复值。 

干货分享

最近将个人学习笔记整理成册,使用PDF分享。关注我,回复如下代码,即可获得百度盘地址,无套路领取!

•001:《Java并发与高并发解决方案》学习笔记;•002:《深入JVM内核——原理、诊断与优化》学习笔记;•003:《Java面试宝典》•004:《Docker开源书》•005:《Kubernetes开源书》•006:《DDD速成(领域驱动设计速成)》•007:全部•008:加技术群讨论

近期热文

LinkedBlockingQueue vs ConcurrentLinkedQueue解读Java 8 中为并发而生的 ConcurrentHashMapRedis性能监控指标汇总最全的DevOps工具集合,再也不怕选型了!微服务架构下,解决数据库跨库查询的一些思路聊聊大厂面试官必问的 MySQL 锁机制

关注我

喜欢就点个"在看"呗^_^

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值