慎用ArrayList的contains方法，使用HashSet的contains方法代替

最新推荐文章于 2023-09-03 12:05:38 发布

huyuminNo1

最新推荐文章于 2023-09-03 12:05:38 发布

阅读量415

点赞数

分类专栏： java 文章标签： java 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huyuminNo1/article/details/84697197

版权

java 专栏收录该内容

108 篇文章 1 订阅

订阅专栏

在启动一个应用的时候，发现其中有一处数据加载要数分钟，刚开始以为是需要load的数据比较多的缘故，查了一下数据库有6条左右，但是单独写了一个数据读取的方法，将这6万多条全部读过来，却只需要不到10秒钟，就觉得这里面肯定有问题，于是仔细看其中的逻辑，其中有一段数据去重的逻辑，就是记录中存在某几个字段相同的，就认为是重复数据，就需要将重复数据给过滤掉。这里就用到了一个List来存放这几个字段所组成的主键，如果发现相同的就不处理，代码无非就是下面这样：

[java] view plain copy

List<string> uniqueKeyList = new ArrayList<string>();
//......
if (uniqueKeyList.contains(uniqueKey)) {
continue;
}
</string></string>

根据键去查找是不是已经存在了，来判断是否重复数据。经过分析，这一块耗费了非常多的时候，于是就去查看ArrayList的contains方法的源码，发现其最终会调用他本身的indexOf方法：

[java] view plain copy

public int indexOf(Object elem) {
if (elem == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (elem.equals(elementData[i]))
return i;
}
return -1;
}

原来在这里他做的是遍历整个list进行查找，最多可能对一个键的查找会达到6万多次，也就是会扫描整个List，验怪会这么慢了。

于是将原来的List替换为Set：

[java] view plain copy

Set<string> uniqueKeySet = new HashSet<string>();
//......
if (uniqueKeySet.contains(uniqueKey)) {
continue;
}

速度一下就上去了，在去重这一块最多花费了一秒钟，为什么HashSet的速度一下就上去了，那是因为其内部使用的是Hashtable，这是HashSet的contains的源码：

[java] view plain copy

public boolean contains(Object o) {
return map.containsKey(o);
}

如果不知道为什么使用Hash就变快了，可以看一下我的另外一篇文章：Java中hashCode的作用

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

huyuminNo1 CSDN认证博客专家 CSDN认证企业博客

码龄17年

365: 原创

-: 周排名

183万+: 总排名

17万+: 访问

: 等级

857: 积分

22: 粉丝

18: 获赞

6: 评论

66: 收藏

私信

关注

热门文章

分类专栏

java 108篇
linux 13篇
手机 4篇
职业生涯 52篇
database 18篇
hibernate 3篇
spring 11篇
english 4篇
算法 11篇
oracle 13篇
web 38篇
健康 16篇
ddd 2篇
windows 14篇
write 21篇
测试 4篇
softwareEnginning 11篇
hessian 1篇
诗文 8篇
freemarker 2篇
cloud 3篇
solr 3篇
债券 13篇
人文
安卓

最新评论

CPU-ES版本
END1516: 请问怎么让ES版本的cpu显示型号
jdk1.5-1.9新特性
Tisfy: 文笔流畅，修辞得体，深得魏晋诸朝遗风
mysql or条件可以使用索引而避免全表
xh2006000: 楼主innodb引擎explain select * from a where id=1 or uid =2;之所以没用到索引，是因为select * 导致的，楼主的数据应该比较少，mysql认为全表扫描比索引更快，所以没用到索引，这应该和or没关系，如果换成explain select id,uid from a where id=1 or uid =2;就会用到索引，楼主可以试一下
mysql or条件可以使用索引而避免全表
xh2006000: 为什么我用or显示也用了索引？
java 实现长链接Comet
fxd12345670: 不知道讲的什么玩意，根本运行都运行不起来

大家在看

《Information Science》Something About Pygame I Try To Coclude

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。