java主要集合类的数据结构学习

最新推荐文章于 2024-07-25 17:43:13 发布

iteye_9550

最新推荐文章于 2024-07-25 17:43:13 发布

阅读量280

点赞数

分类专栏： java 文章标签：数据结构 Java Blog

java 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

在程序中，集合类每天都在使用，以致于某些代码充斥着List和Map，一直没有机会整理下它们背后的实现原理。这几天不太忙，正好可以看会代码，补充下概念。
和集合类的大致分类类似，下面我也分List,Map和Set来描述。

一． List
1).ArrayList
[img]http://langyu.iteye.com/upload/picture/pic/34615/cd6f2ffb-82ec-3082-adfe-afa1b3606308.jpg[/img]

 ArrayList维护着一个对象数组。如果调用new ArrayList()后，它会默认初始一个size=10的数组。
 每次add操作都要检查数组容量，如果不够，重新设置一个初始容量1.5倍大小的新数组，然后再把每个元素copy过去。
 在数组中间插入或删除，都要移动后面的所有元素。（使用System.arraycopy()）

2).LindedList
LinkedList的实现是一个双向链表。每个节点除含有元素外，还包含向前，向后的指针。
新建一个LinkedList，生成一个头节点（header，就是一个头指针），它的元素为null。
[img]http://langyu.iteye.com/upload/picture/pic/34629/0d81a644-d01e-3d73-a61e-d755ebec5d70.jpg[/img]
它自包含，next和previous指针都指向自己。
执行add(Object obj)方法后，会生成一个新节点
[img]http://langyu.iteye.com/upload/picture/pic/34625/91330575-4e1d-37c3-a3a5-ebe8f4a486a2.jpg[/img]
Header节点的next指向链表的第一个节点，previous指向链表的最后一个节点，在这里都是first。
再增加一个对象，它的形状像下面这样。
[img]http://langyu.iteye.com/upload/picture/pic/34627/ad40ad46-8b65-3950-9a9c-4454f08d9f4c.jpg[/img]
现在是一个标准的双向链表形状。每个节点都有自己的next和previous指针。
 增加节点，只会对链表的指针进行操作，速度快
 LinkedList实现了Deque，所以它有双向队列的特征，在链表两端可增删数据
 使用index查找对象时，会以index和size/2比较，从前或从后向中间搜索
 ListIterator可向前或向后迭代

比较ArrayList和LinkedList的结构，就可以得出：
1． ArrayList的remove和add(index, Object)操作代价高，需要移动后面的每个元素。
2． LinkedList的get(index)操作代价高，它要先循环遍历list，找到Object

二． Map
1).HashMap
HashMap的结构是一个散列桶，初始化时生成如下结构
[img]http://langyu.iteye.com/upload/picture/pic/34619/5e379942-a83c-3417-915d-487bfa13cbfe.jpg[/img]
每个bucket包含一个Entry(map自定义的一种结构，包含一个往后的指针)的链表。
在put(key, value)后，它的结构如下
[img]http://langyu.iteye.com/upload/picture/pic/34617/0e37f2c3-0023-35d9-96e9-01adaba642a2.jpg[/img]
将key的hashcode再次散列，然后用这个hash和length-1进行按位与操作，得到bucket的index，然后检查当前bucket的链表，有没有这个key,如果有替换value，没有则跟在链表的最后。
 允许key和value都可以是null
 Index=0的bucket存key=null的value，也可以是其它hashcode为0的项
 初始容量必须为2的幂次（我的理解是，在生成index的时候有这样的代码:hase ^ (length - 1)），length – 1的二进制代码为全1,则容易进行hash的设计）
 如果两个key散列后的index一样的话，第一个key生成的Entry先存在桶中，第二个key生成的Entry会将第一个Entry设为自己的next，串起来。（如图中，先put(yy, “first”)，会将这个Entry设为bucket的第一项，后put(xx,”second”)，则生成新Entry，它的next为key为yy的Entry，生成一个链表）
 在put操作中，会比较threshold（capacity * load_factor，一个临界值），如果size > threshold的话，生成一个当前bucket两倍数量的buckets，然后把现有的数据重新散列到新bucket中
 对HashMap迭代时，返回数据的顺序是:index从0到length-1，循环遍历每个bucket，把不为null的数据取出，每个bucket内的顺序由链表的顺序决定。而不是由插入数据决定。

2).LinkedHashMap
上面说过，Map的迭代不由插入顺序决定。如果要保持这种顺序呢？就要新增加一种结构来保持。
[img]http://langyu.iteye.com/upload/picture/pic/34621/b6f30924-e746-3daa-9765-e15564d34b3d.jpg[/img]
LinkedHashMap是HashMap的子类，增加一个双向链表，用来存储每个新加入的节点。在遍历时，按链表的顺序进行。其实差不多就是上面HashMap和LinkedList的和吧。
三． Set
1).HashSet
HashSet使用HashMap来保持元素。Key = 元素，value是一个公有的对象，对每个元素都一样，在HashMap里面key是惟一的，当然很适合于构造set集合。等同于用HashMap包装了次，显示Set自己的特性。

最后还要提到集合类里面一个很重要的类:Collections，它有很多自己独特的静态方法。当然它主要提供几种特殊集合(List, Map,Set)，可以调用静态方法来获得：Unmodifiable*(不可修改集合，不可添加或删除元素)，Synchronize*(保持同步集合，它的基本每个方法都加锁，防止并发操作)，Checked*(声明之始传入特定类型，以后的操作都会验证加入元素是否属于已定类型)，Singleton*(集合中只包含一个元素)。它们都是通过包装集合类中的抽象类获得，产生不同的行为。

上面是常见的几种集合类，其它类我很少使用到。
不记得是谁说过，我们最容易记住图像化的知识。在学习了部分集合类知识后，总结下，以便以后忘记了还能翻看下。

iteye_9550

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
java主要集合类的数据结构学习

在程序中，集合类每天都在使用，以致于某些代码充斥着List和Map，一直没有机会整理下它们背后的实现原理。这几天不太忙，正好可以看会代码，补充下概念。和集合类的大致分类类似，下面我也分List,Map和Set来描述。一． List1).ArrayList [img]http://langyu.iteye.com/upload/picture/pic/34615/cd6f2ffb...
复制链接

扫一扫

专栏目录