Java程序员从笨鸟到菜鸟之（五）java开发常用类（包装，数字处理集合等）（下）

最新推荐文章于 2021-04-12 16:45:48 发布

jtlyuan

最新推荐文章于 2021-04-12 16:45:48 发布

阅读量485

点赞数

分类专栏： Java 文章标签： java hashmap equals collections arrays 框架

Java 专栏收录该内容

49 篇文章 0 订阅

订阅专栏

本文来自：曹胜欢博客专栏。转载请注明出处：http://blog.csdn.net/csh624366188

写在前面：由于前天项目老师建设局的项目快到验收阶段，所以，前天晚上通宵，昨天睡了大半天，下午我们宿舍聚会，所以时间有点耽误，希望大家见谅

上接：

Java程序员从笨鸟到菜鸟之（四）java开发常用类（包装，数字处理集合等）（上）

3.Set 接口 也是 Collection 的一种扩展，而与 List 不同的时，在 Set 中的对象元素不能重复，也就是说你不能把同样的东西两次放入同一个 Set 容器中。它的常用具体实现有 HashSet 和 TreeSet 类。 HashSet能快速定位一个元素，但是你放到HashSet中的对象需要实现 hashCode()方法，它使用了前面说过的哈希码的算法。而TreeSet则将放入其中的元素按序存放，这就要求你放入其中的对象是可排序的，这就用到了集合框架提供的另外两个实用类Comparable和Comparator。一个类是可排序的，它就应该实现Comparable 接口。有时多个类具有相同的排序算法，那就不需要在每分别重复定义相同的排序算法，只要实现 Comparator 接口即可。集合框架中还有两个很实用的公用类： Collections 和 Arrays 。 Collections 提供了对一个 Collection 容器进行诸如排序、复制、查找和填充等一些非常有用的方法， Arrays 则是对一个数组进行类似的操作。

Hash表
Hash表是一种数据结构，用来查找对象。Hash表为每个对象计算出一个整数，称为Hash Code(哈希码)。Hash表是个链接式列表的阵列。每个列表称为一个buckets(哈希表元)。对象位置的计算　index = HashCode % buckets (HashCode为对象哈希码，buckets为哈希表元总数)。

当你添加元素时，有时你会遇到已经填充了元素的哈希表元，这种情况称为Hash Collisions(哈希冲突)。这时，你必须判断该元素是否已经存在于该哈希表中。
如果哈希码是合理地随机分布的，并且哈希表元的数量足够大，那么哈希冲突的数量就会减少。同时，你也可以通过设定一个初始的哈希表元数量来更好地控制哈希表的运行。初始哈希表元的数量为　buckets = size * 150% + 1 (size为预期元素的数量)。
如果哈希表中的元素放得太满，就必须进行rehashing(再哈希)。再哈希使哈希表元数增倍，并将原有的对象重新导入新的哈希表元中，而原始的哈希表元被删除。load factor(加载因子)决定何时要对哈希表进行再哈希。在Java编程语言中，加载因子默认值为0.75，默认哈希表元为101。
Comparable接口和Comparator接口
在“集合框架”中有两种比较接口：Comparable接口和Comparator接口。像String和Integer等Java内建类实现 Comparable接口以提供一定排序方式，但这样只能实现该接口一次。对于那些没有实现Comparable接口的类、或者自定义的类，您可以通过 Comparator接口来定义您自己的比较方式。

Comparable接口

在java.lang包中，Comparable接口适用于一个类有自然顺序的时候。假定对象集合是同一类型，该接口允许您把集合排序成自然顺序。
(1) int compareTo(Object o): 比较当前实例对象与对象o，如果位于对象o之前，返回负值，如果两个对象在排序中位置相同，则返回0，如果位于对象o后面，则返回正值
在 Java 2 SDK版本1.4中有二十四个类实现Comparable接口。下表展示了8种基本类型的自然排序。虽然一些类共享同一种自然排序，但只有相互可比的类才能排序。

类	排序
BigDecimal,BigInteger,Byte, Double, Float,Integer,Long,Short	按数字大小排序
Character	按 Unicode 值的数字大小排序
String	按字符串中字符 Unicode 值排序

利用Comparable接口创建您自己的类的排序顺序，只是实现compareTo()方法的问题。通常就是依赖几个数据成员的自然排序。同时类也应该覆盖equals()和hashCode()以确保两个相等的对象返回同一个哈希码。

Comparator接口
若一个类不能用于实现java.lang.Comparable，或者您不喜欢缺省的Comparable行为并想提供自己的排序顺序(可能多种排序方式)，你可以实现Comparator接口，从而定义一个比较器。
(1)int compare(Object o1, Object o2): 对两个对象o1和o2进行比较，如果o1位于o2的前面，则返回负值，如果在排序顺序中认为o1和o2是相同的，返回0，如果o1位于o2的后面，则返回正值

“与Comparable相似，0返回值不表示元素相等。一个0返回值只是表示两个对象排在同一位置。由Comparator用户决定如何处理。如果两个不相等的元素比较的结果为零，您首先应该确信那就是您要的结果，然后记录行为。”
(2)boolean equals(Object obj): 指示对象obj是否和比较器相等。
“该方法覆写Object的equals()方法，检查的是Comparator实现的等同性，不是处于比较状态下的对象。”

SortedSet接口

“集合框架”提供了个特殊的Set接口：SortedSet，它保持元素的有序顺序。SortedSet接口为集的视图(子集)和它的两端（即头和尾）提供了访问方法。当您处理列表的子集时，更改视图会反映到源集。此外，更改源集也会反映在子集上。发生这种情况的原因在于视图由两端的元素而不是下标元素指定，所以如果您想要一个特殊的高端元素（toElement）在子集中，您必须找到下一个元素。
添加到SortedSet实现类的元素必须实现Comparable接口，否则您必须给它的构造函数提供一个Comparator接口的实现。TreeSet类是它的唯一一份实现。
“因为集必须包含唯一的项，如果添加元素时比较两个元素导致了0返回值（通过Comparable的compareTo()方法或Comparator 的compare()方法），那么新元素就没有添加进去。如果两个元素相等，那还好。但如果它们不相等的话，您接下来就应该修改比较方法，让比较方法和 equals() 的效果一致。”

(1) Comparator comparator(): 返回对元素进行排序时使用的比较器，如果使用Comparable接口的compareTo()方法对元素进行比较，则返回null
(2) Object first(): 返回有序集合中第一个(最低)元素
(3) Object last(): 返回有序集合中最后一个(最高)元素
(4)SortedSet subSet(Object fromElement, Object toElement): 返回从fromElement(包括)至toElement(不包括)范围内元素的SortedSet视图(子集)
(5) SortedSet headSet(Object toElement): 返回SortedSet的一个视图，其内各元素皆小于toElement
(6) SortedSet tailSet(Object fromElement): 返回SortedSet的一个视图，其内各元素皆大于或等于fromElement
AbstractSet抽象类
AbstractSet类覆盖了Object类的equals()和hashCode()方法，以确保两个相等的集返回相同的哈希码。若两个集大小相等且包含相同元素，则这两个集相等。按定义，集的哈希码是集中元素哈希码的总和。因此，不论集的内部顺序如何，两个相等的集会有相同的哈希码。

HashSet类类和TreeSet类

“集合框架”支持Set接口两种普通的实现：HashSet和TreeSet(TreeSet实现SortedSet接口)。在更多情况下，您会使用 HashSet 存储重复自由的集合。考虑到效率，添加到 HashSet 的对象需要采用恰当分配哈希码的方式来实现hashCode()方法。虽然大多数系统类覆盖了 Object中缺省的hashCode()和equals()实现，但创建您自己的要添加到HashSet的类时，别忘了覆盖 hashCode()和equals()。
当您要从集合中以有序的方式插入和抽取元素时，TreeSet实现会有用处。为了能顺利进行，添加到TreeSet的元素必须是可排序的。

HashSet类

(1) HashSet(): 构建一个空的哈希集

(2) HashSet(Collection c): 构建一个哈希集，并且添加集合c中所有元素

(3) HashSet(int initialCapacity): 构建一个拥有特定容量的空哈希集

(4) HashSet(int initialCapacity, float loadFactor): 构建一个拥有特定容量和加载因子的空哈希集。LoadFactor是0.0至1.0之间的一个数

TreeSet类

(1) TreeSet():构建一个空的树集

(2) TreeSet(Collection c): 构建一个树集，并且添加集合c中所有元素

(3) TreeSet(Comparator c): 构建一个树集，并且使用特定的比较器对其元素进行排序
“comparator比较器没有任何数据，它只是比较方法的存放器。这种对象有时称为函数对象。函数对象通常在“运行过程中”被定义为匿名内部类的一个实例。”

TreeSet(SortedSet s): 构建一个树集，添加有序集合s中所有元素，并且使用与有序集合s相同的比较器排序

LinkedHashSet类

LinkedHashSet扩展HashSet。如果想跟踪添加给HashSet的元素的顺序，LinkedHashSet实现会有帮助。 LinkedHashSet的迭代器按照元素的插入顺序来访问各个元素。它提供了一个可以快速访问各个元素的有序集合。同时，它也增加了实现的代价，因为哈希表元中的各个元素是通过双重链接式列表链接在一起的。
(1) LinkedHashSet(): 构建一个空的链接式哈希集

(2) LinkedHashSet(Collection c): 构建一个链接式哈希集，并且添加集合c中所有元素

(3) LinkedHashSet(int initialCapacity): 构建一个拥有特定容量的空链接式哈希集

(4) LinkedHashSet(int initialCapacity, float loadFactor): 构建一个拥有特定容量和加载因子的空链接式哈希集。LoadFactor是0.0至1.0之间的一个数
“为优化HashSet空间的使用，您可以调优初始容量和负载因子。TreeSet不包含调优选项，因为树总是平衡的。”

4.Map是一种把键对象和值对象进行关联的容器，而一个值对象又可以是一个Map，依次类推，这样就可形成一个多级映射。对于键对象来说，像Set一样，一个Map容器中的键对象不允许重复，这是为了保持查找结果的一致性;如果有两个键对象一样，那你想得到那个键对象所对应的值对象时就有问题了，可能你得到的并不是你想的那个值对象，结果会造成混乱，所以键的唯一性很重要，也是符合集合的性质的。当然在使用过程中，某个键所对应的值对象可能会发生变化，这时会按照最后一次修改的值对象与键对应。对于值对象则没有唯一性的要求。你可以将任意多个键都映射到一个值对象上，这不会发生任何问题（不过对你的使用却可能会造成不便，你不知道你得到的到底是那一个键所对应的值对象）。Map有两种比较常用的实现：HashMap和TreeMap。HashMap也用到了哈希码的算法，以便快速查找一个键，TreeMap则是对键按序存放，因此它便有一些扩展的方法，比如firstKey(),lastKey()等，你还可以从TreeMap中指定一个范围以取得其子Map。键和值的关联很简单，用pub(Object key,Object value)方法即可将一个键与一个值对象相关联。用get(Object key)可得到与此key对象所对应的值对象。

Map接口不是Collection接口的继承。Map接口用于维护键/值对(key/value pairs)。该接口描述了从不重复的键到值的映射。

(1) 添加、删除操作：

Object put(Object key, Object value): 将互相关联的一个关键字与一个值放入该映像。如果该关键字已经存在，那么与此关键字相关的新值将取代旧值。方法返回关键字的旧值，如果关键字原先并不存在，则返回null

Object remove(Object key): 从映像中删除与key相关的映射

void putAll(Map t): 将来自特定映像的所有元素添加给该映像

void clear(): 从映像中删除所有映射

“键和值都可以为null。但是，您不能把Map作为一个键或值添加给自身。”

(2) 查询操作：

Object get(Object key): 获得与关键字key相关的值，并且返回与关键字key相关的对象，如果没有在该映像中找到该关键字，则返回null

boolean containsKey(Object key): 判断映像中是否存在关键字key

boolean containsValue(Object value): 判断映像中是否存在值value

int size(): 返回当前映像中映射的数量

boolean isEmpty() ：判断映像中是否有任何映射

(3) 视图操作：处理映像中键/值对组

Set keySet(): 返回映像中所有关键字的视图集

“因为映射中键的集合必须是唯一的，您用Set支持。你还可以从视图中删除元素，同时，关键字和它相关的值将从源映像中被删除，但是你不能添加任何元素。”

Collection values():返回映像中所有值的视图集

“因为映射中值的集合不是唯一的，您用Collection支持。你还可以从视图中删除元素，同时，值和它的关键字将从源映像中被删除，但是你不能添加任何元素。”

Set entrySet(): 返回Map.Entry对象的视图集，即映像中的关键字/值对

“因为映射是唯一的，您用Set支持。你还可以从视图中删除元素，同时，这些元素将从源映像中被删除，但是你不能添加任何元素。”

Map.Entry接口
Map的entrySet()方法返回一个实现Map.Entry接口的对象集合。集合中每个对象都是底层Map中一个特定的键/值对。
通过这个集合的迭代器，您可以获得每一个条目(唯一获取方式)的键或值并对值进行更改。当条目通过迭代器返回后，除非是迭代器自身的remove()方法或者迭代器返回的条目的setValue()方法，其余对源Map外部的修改都会导致此条目集变得无效，同时产生条目行为未定义。
(1) Object getKey(): 返回条目的关键字

(2) Object getValue(): 返回条目的值

(3) Object setValue(Object value): 将相关映像中的值改为value，并且返回旧值

SortedMap接口

“集合框架”提供了个特殊的Map接口：SortedMap，它用来保持键的有序顺序。

SortedMap接口为映像的视图(子集)，包括两个端点提供了访问方法。除了排序是作用于映射的键以外，处理SortedMap和处理SortedSet一样。

添加到SortedMap实现类的元素必须实现Comparable接口，否则您必须给它的构造函数提供一个Comparator接口的实现。TreeMap类是它的唯一一份实现。

“因为对于映射来说，每个键只能对应一个值，如果在添加一个键/值对时比较两个键产生了0返回值（通过Comparable的compareTo()方法或通过Comparator的compare()方法），那么，原始键对应值被新的值替代。如果两个元素相等，那还好。但如果不相等，那么您就应该修改比较方法，让比较方法和 equals() 的效果一致。”

(1) Comparator comparator(): 返回对关键字进行排序时使用的比较器，如果使用Comparable接口的compareTo()方法对关键字进行比较，则返回null

(2) Object firstKey(): 返回映像中第一个(最低)关键字

(3) Object lastKey(): 返回映像中最后一个(最高)关键字

(4) SortedMap subMap(Object fromKey, Object toKey): 返回从fromKey(包括)至toKey(不包括)范围内元素的SortedMap视图(子集)

(5) SortedMap headMap(Object toKey): 返回SortedMap的一个视图，其内各元素的key皆小于toKey

(6) SortedSet tailMap(Object fromKey): 返回SortedMap的一个视图，其内各元素的key皆大于或等于fromKey

AbstractMap抽象类

和其它抽象集合实现相似，AbstractMap 类覆盖了equals()和hashCode()方法以确保两个相等映射返回相同的哈希码。如果两个映射大小相等、包含同样的键且每个键在这两个映射中对应的值都相同，则这两个映射相等。映射的哈希码是映射元素哈希码的总和，其中每个元素是Map.Entry接口的一个实现。因此，不论映射内部顺序如何，两个相等映射会报告相同的哈希码。

HashMap类和TreeMap类

“集合框架”提供两种常规的 Map实现：HashMap和TreeMap (TreeMap实现SortedMap接口)。在Map 中插入、删除和定位元素，HashMap 是最好的选择。但如果您要按自然顺序或自定义顺序遍历键，那么TreeMap会更好。使用HashMap要求添加的键类明确定义了hashCode()和 equals()的实现。

这个TreeMap没有调优选项，因为该树总处于平衡状态。

HashMap类

为了优化HashMap空间的使用，您可以调优初始容量和负载因子。

(1) HashMap(): 构建一个空的哈希映像

(2) HashMap(Map m): 构建一个哈希映像，并且添加映像m的所有映射

(3) HashMap(int initialCapacity): 构建一个拥有特定容量的空的哈希映像

(4) HashMap(int initialCapacity, float loadFactor): 构建一个拥有特定容量和加载因子的空的哈希映像

TreeMap类

TreeMap没有调优选项，因为该树总处于平衡状态。

(1) TreeMap():构建一个空的映像树

(2) TreeMap(Map m): 构建一个映像树，并且添加映像m中所有元素

(3) TreeMap(Comparator c): 构建一个映像树，并且使用特定的比较器对关键字进行排序

(4) TreeMap(SortedMap s): 构建一个映像树，添加映像树s中所有映射，并且使用与有序映像s相同的比较器排序

LinkedHashMap类

LinkedHashMap扩展HashMap，以插入顺序将关键字/值对添加进链接哈希映像中。象LinkedHashSet一样，LinkedHashMap内部也采用双重链接式列表。

(1) LinkedHashMap(): 构建一个空链接哈希映像

(2) LinkedHashMap(Map m): 构建一个链接哈希映像,并且添加映像m中所有映射

(3) LinkedHashMap(int initialCapacity): 构建一个拥有特定容量的空的链接哈希映像

(4) LinkedHashMap(int initialCapacity, float loadFactor): 构建一个拥有特定容量和加载因子的空的链接哈希映像

(5) LinkedHashMap(int initialCapacity, float loadFactor,

boolean accessOrder): 构建一个拥有特定容量、加载因子和访问顺序排序的空的链接哈希映像

“如果将accessOrder设置为true,那么链接哈希映像将使用访问顺序而不是插入顺序来迭

代各个映像。每次调用get或者put方法时，相关的映射便从它的当前位置上删除，然后放到链接式映像列表的结尾处（只有链接式映像列表中的位置才会受到影响，哈希表元则不受影响。哈希表映射总是待在对应于关键字的哈希码的哈希表元中）。”

“该特性对于实现高速缓存的“删除最近最少使用”的原则很有用。例如，你可以希望将最常访问的映射保存在内存中，并且从数据库中读取不经常访问的对象。当你在表中找不到某个映射，并且该表中的映射已经放得非常满时，你可以让迭代器进入该表，将它枚举的开头几个映射删除掉。这些是最近最少使用的映射。”

(6) protected boolean removeEldestEntry(Map.Entry eldest): 如果你想删除最老的映射，则覆盖该方法，以便返回true。当某个映射已经添加给映像之后，便调用该方法。它的默认实现方法返回false，表示默认条件下老的映射没有被删除。但是你可以重新定义本方法，以便有选择地在最老的映射符合某个条件，或者映像超过了某个大小时，返回true。