数据量比较大的两个集合,求交集和差集
1、求交集
1.1、使用 retainAll 函数求交集
import java.util.*;
/**
* 求交集 1
*/
public class ListIntersection1 {
public static void main(String[] args) {
List<String> listA = new ArrayList<String>();
for (int i= 1; i<=200000; i++)
listA.add(String.valueOf(i));
System.out.println("listA 集合长度 : " + listA.size());
List<String> listB = new ArrayList<String>();
for (int i= 100000; i<=300000; i++)
listB.add(String.valueOf(i));
System.out.println("listB 集合长度 : " + listB.size());
long startTime1 = System.currentTimeMillis();
// 求交集
listA.retainAll(listB);
System.out.println("result 集合长度 : " + listA.size());
long endTime1 = System.currentTimeMillis();
long timeDif = (endTime1 - startTime1);
System.out.println("求交集 耗时 : " + timeDif + " ms");
}
}
执行结果:
直接导致程序处于假死状态(程序当然是还在运行).
1.2、使用 LinkedList + 迭代器求交集
import java.util.*;
/**
* 求交集 2
*/
public class ListIntersection2 {
public static void main(String[] args) {
List<String> listA = new ArrayList<String>();
for (int i= 1; i<=2000000; i++)
listA.add(String.valueOf(i));
System.out.println("listA 集合长度 : " + listA.size());
List<String> listB = new ArrayList<String>();
for (int i= 100000; i<=3000000; i++)
listB.add(String.valueOf(i));
System.out.println("listB 集合长度 : " + listB.size());
long startTime1 = System.currentTimeMillis();
// 求交集
List<String> result = receiveCollectionList(listA,listB);
System.out.println("result 集合长度 : " + result.size());
long endTime1 = System.currentTimeMillis();
long timeDif = (endTime1 - startTime1);
System.out.println("求交集 耗时 : " + timeDif + " ms");
}
/**
* 获取两个ArrayList的交集
* @param firstArrayList 第一个 ArrayList 集合
* @param secondArrayList 第二个 ArrayList 集合
* @return
*/
public static List<String> receiveCollectionList(List<String> firstArrayList,
List<String> secondArrayList) {
if (firstArrayList == null || firstArrayList.size() == 0
|| secondArrayList == null || secondArrayList.size() == 0)
return null;
/** 大集合用 LinkedList **/
LinkedList<String> result = new LinkedList<String>(firstArrayList);
/** 小集合用 HashSet **/
HashSet<String> othHash = new HashSet<String>(secondArrayList);
/** 采用Iterator迭代器进行数据的操作 **/
Iterator<String> iter = result.iterator();
while(iter.hasNext()) {
if(!othHash.contains(iter.next())) iter.remove();
}
return new ArrayList<String>(result);
}
}
执行结果:
2、求差集
2.1、使用 removeAll 函数求差集
import java.util.*;
/**
* 求差集 1
*/
public class ListIntersection2 {
public static void main(String[] args) {
List<String> listA = new ArrayList<String>();
for (int i= 1; i<=200000; i++)
listA.add(String.valueOf(i));
System.out.println("listA 集合长度 : " + listA.size());
List<String> listB = new ArrayList<String>();
for (int i= 100000; i<=300000; i++)
listB.add(String.valueOf(i));
System.out.println("listB 集合长度 : " + listB.size());
long startTime1 = System.currentTimeMillis();
// 求差集,从listA列表中移除所有listB元素
listA.removeAll(listB);
System.out.println("result 集合长度 : " + listA.size());
long endTime1 = System.currentTimeMillis();
long timeDif = (endTime1 - startTime1);
System.out.println("求交集 耗时 : " + timeDif + " ms");
}
}
2.2、使用 LinkedList + 迭代器求差集
/**
* @方法描述:获取两个ArrayList的差集
* @param firstArrayList 第一个ArrayList
* @param secondArrayList 第二个ArrayList
* @return resultList 差集ArrayList
*/
public List<String> receiveDefectList(List<String> firstArrayList, List<String> secondArrayList) {
List<String> resultList = new ArrayList<String>();
LinkedList<String> result = new LinkedList<String>(firstArrayList);// 大集合用linkedlist
HashSet<String> othHash = new HashSet<String>(secondArrayList);// 小集合用hashset
Iterator<String> iter = result.iterator();// 采用Iterator迭代器进行数据的操作
while(iter.hasNext()){
if(othHash.contains(iter.next())){
iter.remove();
}
}
resultList = new ArrayList<String>(result);
firstArrayList.clear();
resultList.forEach(o-> firstArrayList.add(o));
return firstArrayList;
}
数据量达到十万、百万级时,建议使用后者
.