ArrayList
集合中存放的依然是对象的引用而不是对象本身。
ArrayList底层采用数组实现,当使用不带参数的构造方法生成ArrayList对象时,实际上会在底层生成一个长度为10的Object类型数组。
如果增加的元素个数超过了10个,那么ArrayList底层会新生成一个数组,长度为原数组的1.5倍+1,然后将原数组的内容复制到新数组当中,并且后续增加的内容都会放到新数组当中。当新数组无法容纳增加的元素时,重复该过程。
对于ArrayList元素的删除操作,需要将被删除元素的后续元素向前移动,代价比较高。
集合当中只能放置对象的引用,无法放置原生数据类型,我们需要使用原生数据类型的包装类才能加入到集合当中。
集合当中放置的都是Object类型,因此取出来的也是Object类型,那么必须使用强制类型转换将其转换为真正的类型(放置进去的类型)。
关于ArrayList与LinkedList的比较分析
1)ArrayList底层采用数组实现,LinkedList底层采用双向链表生成。
2)当采用插入或者删除操作时,采用LinkedList比较好。
3)当执行搜索操作时,当执行搜索操作时,采用ArrayList比较好。
当向ArrayList添加一个对象时,实际上就是将对象放置到了ArrayList底层所维护的数组当中;当向LinkedList中添加一个对象时,实际上LinkedList内部会生成一个Entry对象,该对象结构为:
Entry
{
Entry previous;
Object element;
Entry next;
}
其中的Object类型的元素element就是我们向LinkedList中所添加的元素,然后Entry又构造好了向前与向后的引用previous、next,最后将生成的这个Entry对象加入到了链表当中,也就是说,LinkedList中所维护的是一个个的Entry对象。
Set集合
关于Object类的equals方法的特点
自反性:对于任何非空引用值 x
,x.equals(x)
都应返回true
。
对称性:对于任何非空引用值 x
和 y
,当且仅当 y.equals(x)
返回true
时,x.equals(y)
才应返回true
。
传递性:对于任何非空引用值 x
、y
和 z
,如果 x.equals(y)
返回 true
,并且 y.equals(z)
返回 true
,那么x.equals(z)
应返回true
。
一致性:对于任何非空引用值 x
和 y
,多次调用 x.equals(y) 始终返回 true
或始终返回 false
,前提是对象上 equals
比较中所用的信息没有被修改。
对于任何非空引用值 x
,x.equals(null)
都应返回 false
。
关于Object类的hashCode()方法的特点
1)在java应用的一次执行过程当中,对于同于一个对象的hashCode()的多次调用,他们应该返回同样的值(前提是该对象的信息没有发生改变)。
2)对于两个对象来说,如果equals方法比较返回true,那么这两个对象的hashCode值一定是相同的
3)对于两个对象来说,如果使用equals方法返回比较返回false,那么这两个对象的hashcode值不要求一定不同(可以相同,可以不同),但是如果不同可以提高哈希表的性能。
4)对于Object类来说,不同的Object对象的hashCode值是不同的(Object类的hashCode值表示的是对象的地址)。
当使用HashSet时,hashCode方法就会得到调用,判断已经存储在集合中的对象的hashcode值是否与增加的对象的hash code值一致;如果不一致,直接加进去;如果一致,再进行equals方法的比较,equals方法如果返回true,表示对象已经加进去了,就不会再增加新的对象,否则加进去。
判断一个对象会不会放到集合中,是由hashCode和equals两个方法共同决定的。
如果我们重写equals方法,那么也要重写hashCode方法,反之也是。
对于String类,它重写了hashCode方法
public class SetTest1 {
public static void main(String[] args){
HashSet set1 = new HashSet();
HashSet set2 = new HashSet();
set1.add(new People("zhangsan"));
set1.add(new People("Lisi"));
set1.add(new People("zhangsan"));
People p1 = new People("zhangsan");
set1.add(p1);
set1.add(p1);
System.out.println(set1);//set1集合中存放了四个对象,四个对象的hashcode值不相同,直接加入集合中
String s1 = new String("aaa") ;
String s2 = new String("aaa");
System.out.println(s1==s2);
System.out.println(s1.equals(s2));
System.out.println(s1.hashCode());
System.out.println(s2.hashCode());
set2.add(s1);
set2.add(s2);
System.out.println(set2);//set2集合中存放了一个对象,String类重写了hashCode方法,s1.hashCode()==s2.hashCode()并且s1.equlas(s2),所以s2对象不放入
//集合中
}
}
TreeSet
使用元素的自然顺序对元素进行排序,或者根据创建 set 时提供的 Comparator进行排序,具体取决于使用的构造方法。
public class TreeSetTest {
public static void main(String[] args){
TreeSet set = new TreeSet(new MyComparator());
Person p1 = new Person(10);
Person p2 = new Person(20);
Person p3 = new Person(30);
set.add(p1);
set.add(p2);
set.add(p3);
for(Iterator it = set.iterator();it.hasNext();){
System.out.println(it.next());
}
}
}
class Person{
int score;
Person(int score) {
this.score = score;
}
public String toString(){
return String.valueOf(this.score);
}
}
class MyComparator implements Comparator{ //自己实现的比较器
@Override
public int compare(Object o1, Object o2) {
Person person1 = (Person) o1;
Person person2 = (Person) o2;
return person2.score-person1.score;
}
}
Map(映射):Map的keySet()方法会返回key的集合,因为Map的键是不能重复的,因此keySet()方法的返回类型是Set;而Map的值是可以重复的,因此values()的返回类型是Collection,可以容纳重复的元素。
HashSet和HashMap的源码分析
HashSet底层是采用HashMap实现的。当使用add方法将对象添加到Set当中时,实际上是将该对象作为底层所维护的Map对象的key,而value则都是同一个Object对象(该对象我们用不上)
HashMap底层维护着一个数组(类型是HashMap.Entry),我们向HashMap中所放置的对象实际上是存储在该数组当中。
当向HashMap中put一对键值时,它会根据key的hashCode值计算出一个位置,该位置就是此对象准备往数组中存放的位置。如果该位置没有对象存在,就将此对象直接放进数组当中;如果该位置已经有对象存在了,则顺着此存在的对象的链开始寻找(Entry类有一个Entry类型的next成员变量,指向了该对象的下一个对象),如果此链上有对象的话,再去使用equals方法进行比较,如果对此链上的某个对象的equals方法比较为false,则将该对象放到数组当中,然后将该数组中该位置以前存在的那个对象链接到此对象的后面。(可以去看hashMap实现源码进行理解)
HashSet实现了Set接口,它不允许集合中有重复的值,当我们提到HashSet时,第一件事情就是在将对象存储在HashSet之前,要先确保对象重写equals()和hashCode()方法,这样才能比较对象的值是否相等,以确保set中没有储存相等的对象。如果我们没有重写这两个方法,将会使用这个方法的默认实现。
public boolean add(Object o)方法用来在Set中添加元素,当元素值重复时则会立即返回false,如果成功添加的话会返回true。
HashMap实现了Map接口,Map接口对键值对进行映射。Map中不允许重复的键。Map接口有两个基本的实现,HashMap和TreeMap。TreeMap保存了对象的排列次序,而HashMap则不能。HashMap允许键和值为null。HashMap是非synchronized的,但collection框架提供方法能保证HashMap synchronized,这样多个线程同时访问HashMap时,能保证只有一个线程更改Map。
public Object put(Object Key,Object value)方法用来将元素添加到map中。
HashSet和HashMap的区别
HashMap | HashSet |
HashMap实现了Map接口 | HashSet实现了Set接口 |
HashMap储存键值对 | HashSet仅仅存储对象 |
使用put()方法将元素放入map中 | 使用add()方法将元素放入set中 |
HashMap中使用键对象来计算hashcode值 | HashSet使用成员对象来计算hashcode值,对于两个对象来说hashcode可能相同,所以equals()方法用来判断对象的相等性,如果两个对象不同的话,那么返回false |
HashMap比较快,因为是使用唯一的键来获取对象 | HashSet较HashMap来说比较慢 |
HashMap和Hashtable的区别
HashMap和Hashtable都实现了Map接口,但决定用哪一个之前先要弄清楚它们之间的分别。主要的区别有:线程安全性,同步(synchronization),以及速度。
- HashMap几乎可以等价于Hashtable,除了HashMap是非synchronized的,并可以接受null(HashMap可以接受为null的键值(key)和值(value),而Hashtable则不行)。
- HashMap是非synchronized,而Hashtable是synchronized,这意味着Hashtable是线程安全的,多个线程可以共享一个Hashtable;而如果没有正确的同步的话,多个线程是不能共享HashMap的。Java 5提供了ConcurrentHashMap,它是HashTable的替代,比HashTable的扩展性更好。
- 另一个区别是HashMap的迭代器(Iterator)是fail-fast迭代器,而Hashtable的enumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构(增加或者移除元素),将会抛出ConcurrentModificationException,但迭代器本身的remove()方法移除元素则不会抛出ConcurrentModificationException异常。但这并不是一个一定发生的行为,要看JVM。这条同样也是Enumeration和Iterator的区别。
- 由于Hashtable是线程安全的也是synchronized,所以在单线程环境下它比HashMap要慢。如果你不需要同步,只需要单一线程,那么使用HashMap性能要好过Hashtable。
- HashMap不能保证随着时间的推移Map中的元素次序是不变的。