java stream 多个集合去重取交集

文章介绍了一种使用JavaStreamAPI来找出多个List<Teacher>集合的交集,并通过过滤和去重操作得到唯一元素的方法。示例代码展示了如何通过filter和distinctByKey函数以及ConcurrentHashMap实现这一功能。
摘要由CSDN通过智能技术生成

文章目录

背景

原因是需要从表里查多个集合list,然后取多个集合得交集,并且元素是对象,所以使用了下面的方式,当然方式有很多种,仅供参考。

案例

下面提供了一段多个集合join取交集的例子,代码中,采用List为集合,Teacher为元素。

package stream;

import java.util.*;
import java.util.concurrent.ConcurrentHashMap;
import java.util.function.Function;
import java.util.function.Predicate;
import java.util.stream.Collectors;

/**
 * 求多个List<Object>集合的交集
 *
 * @author happy
 * @since 2023-06-27
 */
public class DistinctEntityByStream {
    public static void main(String[] args) {
        getDistinctList();
    }

    private static void getDistinctList() {
        List<Teacher> list = new ArrayList<>();
        list.add(new Teacher(10, "zhang", 24));
        list.add(new Teacher(10, "zhang", 24));
        list.add(new Teacher(10, "zhang", 24));
        list.add(new Teacher(10, "zhang", 24));
        list.add(new Teacher(5, "zhang2", 34));
        list.add(new Teacher(6, "zhang3", 26));
        list.add(new Teacher(6, "zhang3", 26));
        list.add(new Teacher(6, "zhang3", 26));
        list.add(new Teacher(6, "zhang3", 26));
        list.add(new Teacher(7, "zhang4", 24));
        list.add(new Teacher(7, "zhang4", 24));

        List<Teacher> teacherList = list
                .stream()
                .filter(one -> Collections.frequency(list, one) == 4)
                .filter(distinctByKey(Teacher::getId))
                .sorted(Comparator.comparing(Teacher::getId))
                .collect(Collectors.toList());
		teacherList.forEach(System.out::println);
    }

    private static <T> Predicate<T> distinctByKey(Function<? super T, ?> keyExtractor) {
        ConcurrentHashMap<Object, Boolean> seen = new ConcurrentHashMap<>();
        return t -> seen.putIfAbsent(keyExtractor.apply(t), Boolean.TRUE) == null;
    }

    public static class Teacher {
        private Integer id;
        private String name;
        private Integer age;

        public Teacher(Integer id, String name, Integer age) {
            this.id = id;
            this.name = name;
            this.age = age;
        }

        public Integer getId() {
            return id;
        }

        public void setId(Integer id) {
            this.id = id;
        }

        public String getName() {
            return name;
        }

        public void setName(String name) {
            this.name = name;
        }

        public Integer getAge() {
            return age;
        }

        public void setAge(Integer age) {
            this.age = age;
        }

        @Override
        public boolean equals(Object o) {
            if (this == o) return true;
            if (o == null || getClass() != o.getClass()) return false;
            Teacher teacher = (Teacher) o;
            return Objects.equals(id, teacher.id) && Objects.equals(name, teacher.name) && Objects.equals(age, teacher.age);
        }

        @Override
        public int hashCode() {
            return Objects.hash(id, name, age);
        }

		@Override
        public String toString() {
            return "Teacher{" +
                    "id=" + id +
                    ", name='" + name + '\'' +
                    ", age=" + age +
                    '}';
        }
    }

}

上面代码在idea中运行结果:

Teacher{id=6, name='zhang3', age=26}
Teacher{id=10, name='zhang', age=24}

代码

代码地址

Java Stream API 提供了一种强大的方法来操作集合数据,其中包括了`distinct()`方法用于去除集合中的重复元素。这个方法能够确保结果集中的每个元素都是唯一的。 ### Java Stream集合去重步骤: #### 示例代码: 假设我们有一个包含整数列表的集合 `list`: ```java List<Integer> list = Arrays.asList(1, 2, 2, 3, 4, 4, 5); ``` 我们可以使用 Stream API 的 `distinct()` 方法来进行去重: ```java Stream<Integer> distinctStream = list.stream().distinct(); List<Integer> uniqueList = distinctStream.collect(Collectors.toList()); ``` 在这个例子中: 1. `.stream()` 将原始列表转换为 Stream 对象。 2. `.distinct()` 方法用于移除重复的元素,确保只有唯一值出现在结果集中。 3. `.collect(Collectors.toList())` 将流转换回列表形式。 ### 使用 `distinct()` 方法的详细说明: `distinct()` 方法是一个最终操作,这意味着它会立即执行并生成结果,而不是像其他一些操作那样在流上缓存数据以便后续操作复用。因此,在使用 `.distinct()` 后紧接着的操作通常需要将结果收集到一个新的集合中,如上述示例中的 `.collect(Collectors.toList())`。 ### 相关问题: 1. **如何验证去重后的集合确实不含重复项?** 可以通过遍历去重后的集合,并检查其大小是否等于原始集合去重前的唯一元素的数量,或者直接比较两个集合的元素,看它们是否完全一致。 2. **在哪些场景下可以高效地使用`distinct()`方法?** 当处理大型数据集并且需要确保结果集的唯一性时,`distinct()` 方法非常有用。特别是当集合中的元素过多,手动检查和删除重复项变得繁琐和低效的时候。 3. **是否存在性能考量时需要避免使用`distinct()`方法的情况?** 虽然 `distinct()` 方法在大多数情况下效率很高,但在处理大量数据或者对性能有极高要求的应用中,考虑到其内部实现涉及额外的比较和状态维护,对于性能敏感的场合,可能会考虑使用其他的去重策略,比如哈希表、位向量等非流式方法。此外,如果重复元素的数量极少,频繁调用 `distinct()` 并不一定比简单排序后检查相邻元素是否相等更高效。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

京河小蚁

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值