1 HashMap与HashTable
- HashMap在实现时对null做了特殊处理,将null的hashCode值定为了0,从而将其存放在哈希表的第0个bucket中
- HashMap/HashTable内部用Entry数组实现哈希表;对于映射到同一个哈希桶(数组的同一个位置)的键值对,使用Entry链表来存储(解决hash冲突)
- HashTable默认的初始大小为11,之后每次扩充为原来的2n+1。HashMap默认的初始化大小为16,之后每次扩充为原来的2倍。给定大小时,HashTable会直接使用给定的大小,而HashMap会将其扩充为2的幂次方大小
- 鉴于链表的查询效率较低,JDK 1.8中,映射到同一个哈希桶(数组位置)的Entry对象,使用了红黑树来存储,提高查找效率
- HashTable是同步的,HashMap不是,也就是说HashTable在多线程使用的情况下,不需要做额外的同步,而HashMap则不行(HashTable公开的方法比如get都使用了synchronized描述符。而遍历视图如keySet都使用了Collections.synchronizedXXX进行同步包装)
2 cookie 和session 的区别
- cookie数据存放在客户的浏览器上,session数据放在服务器上。
- cookie不是很安全,别人可以分析存放在本地的COOKIE并进行COOKIE欺骗,考虑到安全应当使用session。
- session会在一定时间内保存在服务器上。当访问增多,会比较占用服务器的性能, 考虑到减轻服务器性能方面,应当使用COOKIE。
- 单个cookie保存的数据不能超过4K,很多浏览器都限制一个站点最多保存20个cookie。
- 一般将登陆信息等重要信息存放为SESSION;其他信息如果需要保留,可以放在COOKIE中
3 String str="abc" VS String str=new String("abc")
1.String str = "abc" 创建对象的过程
- 首先在常量池中查找是否存在内容为"abc"字符串对象
- 如果不存在则在常量池中创建"abc",并让str引用该对象
- 如果存在则直接让str引用该对象
至于"abc"是怎么保存,保存在哪?
常量池属于类信息的一部分,而类信息反映到JVM内存模型中是对应存在于JVM内存模型的方法区,也就是说这个类信息 中的常量池概念是存在于在方法区中,而方法区是在JVM内存模型中的堆中由JVM来分配的,所以"abc"可以说存在于堆中(而有些资料,为了把方法区的 堆区别于JVM的堆,把方法区称为栈)。一般这种情况下,"abc"在编译时就被写入字节码中,所以class被加载时,JVM就为"abc"在常量池中分配内存,所以和静态区差不多。
2.String str = new String("abc")创建实例的过程
- 首先在堆中(不是常量池)创建一个指定的对象"abc",并让str引用指向该对象
- 在字符串常量池中查看,是否存在内容为"abc"字符串对象
- 若存在,则将new出来的字符串对象与字符串常量池中的对象联系起来
- 若不存在,则在字符串常量池中创建一个内容为"abc"的字符串对象,并将堆中的对象与之联系起来
4 IO和NIO(New Input/Output)
JDK1.4中新加入NIO类,引入了一种基于通道和缓冲区的I/O方式,可以使用Native函数库直接分配堆外内存。通过一个存储在Java堆的DirectByteBuffer对象作为这块内存的引用进行操作,避免在Java堆和Native堆中来回复制数据。NIO是一种同步非阻塞的IO模型。同步是指线程不断轮询IO事件是否就绪,核心是使用Selector代替线程本身轮询IO事件,避免了阻塞,同时减少了不必要的线程消耗;非阻塞是指线程在等待IO时,可以同时做其他任务,核心是通道和缓冲区,当IO事件就绪时,可以通过写道缓冲区,保证IO的成功,而无需线程阻塞式地等待。
NIO程序经常使用ByteBuffer来读取或者写入数据,可以使用ByteBuffer.allocate(capability)或者ByteBuffer.allocteDirect(capability)来分配缓存。第一种方式分配JVM堆内存,属于GC管辖范围,由于需要拷贝所以速度相对较慢;第二种方式分配OS本地内存,由于不需要内存拷贝所以速度相对较快(DirectByteBuffer是Java实现堆外内存的一个重要类,可通过该类实现堆外内存的创建、使用和销毁)。
DirectByteBuffer中的unsafe.allocateMemory(size)是个一个native方法,该方法分配的是堆外内存,通过C的malloc来分配系统本地的内存。DirectByteBuffer该类本身还是位于Java内存模型的堆中,适当的时候会被GC回收,当它被回收前会调用本地方法把直接内存给释放了,所以本地内存可以随DirectByteBuffer对象被回收而自动回收;但如果不断分配本地内存,堆内存很少使用,那么JVM就不需要执行GC,DirectByteBuffer对象们就不会被回收,这时候堆内存充足,但本地内存可能已经使用光了,再次尝试分配本地内存就会出现OutOfMemoryError。
- IO: 面向流,阻塞IO
- NIO:面向缓冲,非阻塞IO
5 MongoDB和Mysql索引
- MongoDB采用B树索引,而Mysql用B+树做索引
B-树和B+树最重要的一个区别就是B+树只有叶节点存放数据,其余节点用来索引,而B-树是每个索引节点都会有Data域。
B+树更适合用来存储外部数据,也就是所谓的磁盘数据。
那么Mysql如何衡量查询效率呢?磁盘IO次数。B-树(B类树)的特点就是每层节点数目非常多,层数很少,目的就是为了就少磁盘IO次数,当查询数据的时候,最好的情况就是很快找到目标索引,然后读取数据,但是B-树的每个节点都有data域(指针),这无疑增大了节点大小,说白了增加了磁盘IO次数(磁盘IO一次读出的数据量大小是固定的,单个数据变大,每次读出的就少,IO次数增多),而B+树除了叶子节点其它节点并不存储数据,节点小,磁盘IO次数就少。这是优点之一。
另一个优点是,B+树所有的Data域在叶子节点,一般来说都会进行优化,将所有的叶子节点用指针串起来。这样遍历叶子节点就能获得全部数据,这样就能进行区间访问了。
MongoDB使用B-树,所有节点都有Data域,只要找到指定索引就可以进行访问,单次查询平均快于Mysql(?)
7 Arrays.asList
List<String> list = Arrays.asList(arr);
Arrays.asList 没有实现add方法。所以以上述方式创建的List 不能使用add()方法。
Arrays.asList源代码:
public static <T> List<T> asList(T... a) {
return new ArrayList<>(a);
}
![点击并拖拽以移动 wAAACH5BAEKAAAALAAAAAABAAEAAAICRAEAOw==](https://img-blog.csdnimg.cn/2022010620462997549.gif)
new ArrayList<>(a) 是Arrays里面的一个静态内部类,继承了 AbstractList。在该 ArrayList 内部没有重写 add() 和 remove() 方法。
8 内存分配及变量存储位置
程序运行时,有六个地可以保存数据:
1、寄存器:这是最快的保存区域,位于处理器内部。寄存器的数量十分有限,所以寄存器是根据需要由编译器分配。没有直接控制权,在程序里也找不到寄存器存在的任何踪迹。
2、栈:存放基本类型的数据和对象的引用,但对象本身不存放在栈中,而是存放在堆中(new出来的对象)。驻留于常规RAM(随机访问存储器)区域。但可通过它的“堆栈指针”获得处理的直接支持。堆栈指针若向下移,会创建新的内存;若向上移,则会释放那些内存。这是一种特别快、特别有效的数据保存方式,仅次于寄存器。创建程序时,java编译器必须准确地知道堆栈内保存的所有数据的“长度”以及“存在时间”。这是由于它必须生成相应的代码,以便向上和向下移动指针。这一限制无疑影响了程序的灵活性,所以尽管有些java数据要保存在堆栈里——特别是对象句柄,但java对象并不放到其中。
3、堆:存放用new产生的数据。一种常规用途的内存池(也在RAM区域),其中保存了java对象。和堆栈不同:“内存堆”或“堆”最吸引人的地方在于编译器不必知道要从堆里分配多少存储空间,也不必知道存储的数据要在堆里停留多长的时间。因此,用堆保存数据时会得到更大的灵活性。要求创建一个对象时,只需用new命令编制相碰的代码即可。执行这些代码时,会在堆里自动进行数据的保存。当然,为达到这种灵活性,必然会付出一定的代价:在堆里分配存储空间时会花掉更长的时间
4、静态域:存放在对象中用static定义的静态成员。这儿的“静态”是指“位于固定位置”。程序运行期间,静态存储的数据将随时等候调用。可用static关键字指出一个对象的特定元素是静态的。但java对象本身永远都不会置入静态存储空间。
5、常量池:存放常量。常数值通常直接置于程序代码内部。这样做是安全的。因为它们永远都不会改变,有的常数需要严格地保护,所以可考虑将它们置入只读存储器(ROM)。
6、非RAM存储:硬盘等永久存储空间。若数据完全独立于一个程序之外,则程序不运行时仍可存在,并在程序的控制范围之外。其中两个最主要的例子便是“流式对象”和“固定对象”。对于流式对象,对象会变成字节流,通常会发给另一台机器,而对于固定对象,对象保存在磁盘中。即使程序中止运行,它们仍可保持自己的状态不变。对于这些类型的数据存储,一个特别有用的技艺就是它们能存在于其他媒体中,一旦需要,甚至能将它们恢复成普通的、基于RAM的对象。