工作中经常遇到需要取两个集合之间的交集、差集情况,但是普通的retainAll()和removeAll()无法满足数据量大的情况,由此就自己尝试运用其他的方法解决。注:如果数据量小的情况下,还是使用retainAll()和removeAll()方便
1.假使不存在重复数据,如果存在重复数据,也会被覆盖掉,实际情况中,重复数据也无意义。
2.取交集或者差集时存在主数据和从数据的关系,可提前判断一下那个集合数据量更多,来决定主从数据,或者经过两轮比较,或者经过两轮比较,获取两个结果集。下面例举中,list1为主数据,list2为从数据。
取交集
public static void main(String[] args) {
//模拟数据
List<Integer> list1 = new ArrayList<>();
List<Integer> list2 = new ArrayList<>();
for (int i = 1; i <= 1000000; i++) {
list1.add(i);
list2.add(1000000 - i);
}
//记录开始时间
long startTime = System.currentTimeMillis();
//最后结果集
List<Integer> resultList = new ArrayList<>();
//中间存储
Map<String, Integer> map = new HashMap<>();
list2.forEach(i2 -> {
map.put(i2 + "", i2);
});
list1.forEach(i1 -> {
Integer m = map.get(i1 + "");
//如果不为空,则证明list1和list2都拥有该数据
if (m != null) {
resultList.add(i1);
}
});
System.out.println("耗时:" + (System.currentTimeMillis() - startTime) + "ms");
System.out.println(resultList.size());
}
运行结果
取差集
public static void main(String[] args) {
//模拟数据
List<Integer> list1 = new ArrayList<>();
List<Integer> list2 = new ArrayList<>();
for (int i = 1; i <= 1000000; i++) {
list1.add(i);
list2.add(1500000 - i);
}
//记录开始时间
long startTime = System.currentTimeMillis();
//最后结果集
List<Integer> resultList = new ArrayList<>();
//中间存储
Map<String, Integer> map = new HashMap<>();
list2.forEach(i2 -> {
map.put(i2 + "", i2);
});
//java学习交流:737251827 进入可领取学习资源及对十年开发经验大佬提问,免费解答!
list1.forEach(i1 -> {
Integer m = map.get(i1 + "");
//如果为空,则证明list2中无该数据
if (m == null) {
resultList.add(i1);
}
});
System.out.println("耗时:" + (System.currentTimeMillis() - startTime) + "ms");
System.out.println(resultList.size());
}
运行结果
总结
在双向一百万的数据情况下,使用retainAll()和removeAll()取交集和差集,都需要很长的时间,但是使用map来存储数据,后续通过循环来对比数据,速度就会有显著提升,此方法可以使用于任意数据结构,只要把中间map的键设置好就可以了。