偶然看到了一些比较有意思的文章,记录一下:
1.使用LinkedHashSet删除arraylist中的重复数据
LinkedHashSet是在一个ArrayList删除重复数据的最佳方法。LinkedHashSet在内部完成两件事:
-
删除重复数据
-
保持添加到其中的数据的顺序
Java示例使用LinkedHashSet删除arraylist中的重复项。在给定的示例中,numbersList是包含整数的arraylist,其中一些是重复的数字。
例如1,3和5.我们将列表添加到LinkedHashSet,然后将内容返回到列表中。结果arraylist没有重复的整数。
@Test
public void testLinkedHashSet(){
List<Integer> numberList = new ArrayList<>(Arrays.asList(2, 1, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7));
System.out.println(numberList);
LinkedHashSet<Integer> linkedHashSet = new LinkedHashSet<>(numberList);
ArrayList<Integer> withoutDuplicateList = new ArrayList<>(linkedHashSet);
System.out.println(withoutDuplicateList);
}
2.使用java8新特性stream进行List去重
要从arraylist中删除重复项,我们也可以使用java 8 stream api。使用steam的distinct()方法返回一个由不同数据组成的流,通过对象的equals()方法进行比较。
收集所有区域数据List使用Collectors.toList()。
Java程序,用于在不使用Set的情况下从java中的arraylist中删除重复项。
@Test
public void testStream(){
List<Integer> numberList = new ArrayList<>(Arrays.asList(2, 1, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7));
System.out.println(numberList);
List<Integer> distinctList = numberList.stream().distinct().collect(Collectors.toList());
System.out.println(distinctList);
}
总结:单从代码来看使用LinkedHashSet的代码相对多一点,这个主要是因为stream的流式方法看上去更简洁,但是测试结果显示第二种耗时是第一种的十几倍,从代码也能大致看到,第一种类似空间换时间的策略,在内存不是那么缺的时候建议还是使用第一种。