java基础总结_java private void-CSDN博客

本文链接：https://blog.csdn.net/private_void/article/details/88025521

本文介绍了Java和数据库的多个知识点。包括HashMap与HashTable的区别、cookie和session的差异、不同方式创建String对象的过程、IO和NIO的特点、MongoDB和Mysql索引的不同、Arrays.asList的特性，还阐述了程序运行时数据的内存分配及存储位置。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 HashMap与HashTable

HashMap在实现时对null做了特殊处理，将null的hashCode值定为了0，从而将其存放在哈希表的第0个bucket中
HashMap/HashTable内部用Entry数组实现哈希表;对于映射到同一个哈希桶（数组的同一个位置）的键值对，使用Entry链表来存储(解决hash冲突)
HashTable默认的初始大小为11，之后每次扩充为原来的2n+1。HashMap默认的初始化大小为16，之后每次扩充为原来的2倍。给定大小时，HashTable会直接使用给定的大小，而HashMap会将其扩充为2的幂次方大小
鉴于链表的查询效率较低，JDK 1.8中，映射到同一个哈希桶（数组位置）的Entry对象，使用了红黑树来存储，提高查找效率
HashTable是同步的，HashMap不是，也就是说HashTable在多线程使用的情况下，不需要做额外的同步，而HashMap则不行（HashTable公开的方法比如get都使用了synchronized描述符。而遍历视图如keySet都使用了Collections.synchronizedXXX进行同步包装）

2 cookie 和session 的区别

cookie数据存放在客户的浏览器上，session数据放在服务器上。
cookie不是很安全，别人可以分析存放在本地的COOKIE并进行COOKIE欺骗，考虑到安全应当使用session。
session会在一定时间内保存在服务器上。当访问增多，会比较占用服务器的性能，考虑到减轻服务器性能方面，应当使用COOKIE。
单个cookie保存的数据不能超过4K，很多浏览器都限制一个站点最多保存20个cookie。
一般将登陆信息等重要信息存放为SESSION；其他信息如果需要保留，可以放在COOKIE中

3 String str="abc" VS String str=new String("abc")

1.String str = "abc" 创建对象的过程

首先在常量池中查找是否存在内容为"abc"字符串对象
如果不存在则在常量池中创建"abc"，并让str引用该对象
如果存在则直接让str引用该对象

至于"abc"是怎么保存，保存在哪？

常量池属于类信息的一部分，而类信息反映到JVM内存模型中是对应存在于JVM内存模型的方法区，也就是说这个类信息中的常量池概念是存在于在方法区中，而方法区是在JVM内存模型中的堆中由JVM来分配的，所以"abc"可以说存在于堆中（而有些资料，为了把方法区的堆区别于JVM的堆，把方法区称为栈）。一般这种情况下，"abc"在编译时就被写入字节码中，所以class被加载时，JVM就为"abc"在常量池中分配内存，所以和静态区差不多。

2.String str = new String("abc")创建实例的过程

首先在堆中（不是常量池）创建一个指定的对象"abc"，并让str引用指向该对象
在字符串常量池中查看，是否存在内容为"abc"字符串对象
若存在，则将new出来的字符串对象与字符串常量池中的对象联系起来
若不存在，则在字符串常量池中创建一个内容为"abc"的字符串对象，并将堆中的对象与之联系起来

4 IO和NIO(New Input/Output)

JDK1.4中新加入NIO类,引入了一种基于通道和缓冲区的I/O方式，可以使用Native函数库直接分配堆外内存。通过一个存储在Java堆的DirectByteBuffer对象作为这块内存的引用进行操作，避免在Java堆和Native堆中来回复制数据。NIO是一种同步非阻塞的IO模型。同步是指线程不断轮询IO事件是否就绪，核心是使用Selector代替线程本身轮询IO事件，避免了阻塞，同时减少了不必要的线程消耗；非阻塞是指线程在等待IO时，可以同时做其他任务，核心是通道和缓冲区，当IO事件就绪时，可以通过写道缓冲区，保证IO的成功，而无需线程阻塞式地等待。

NIO程序经常使用ByteBuffer来读取或者写入数据，可以使用ByteBuffer.allocate(capability)或者ByteBuffer.allocteDirect(capability)来分配缓存。第一种方式分配JVM堆内存，属于GC管辖范围，由于需要拷贝所以速度相对较慢；第二种方式分配OS本地内存，由于不需要内存拷贝所以速度相对较快（DirectByteBuffer是Java实现堆外内存的一个重要类，可通过该类实现堆外内存的创建、使用和销毁）。

DirectByteBuffer中的unsafe.allocateMemory(size)是个一个native方法，该方法分配的是堆外内存，通过C的malloc来分配系统本地的内存。DirectByteBuffer该类本身还是位于Java内存模型的堆中，适当的时候会被GC回收，当它被回收前会调用本地方法把直接内存给释放了，所以本地内存可以随DirectByteBuffer对象被回收而自动回收；但如果不断分配本地内存，堆内存很少使用，那么JVM就不需要执行GC，DirectByteBuffer对象们就不会被回收，这时候堆内存充足，但本地内存可能已经使用光了，再次尝试分配本地内存就会出现OutOfMemoryError。

IO：面向流，阻塞IO
NIO：面向缓冲，非阻塞IO

5 MongoDB和Mysql索引

MongoDB采用B树索引，而Mysql用B+树做索引

B-树和B+树最重要的一个区别就是B+树只有叶节点存放数据，其余节点用来索引，而B-树是每个索引节点都会有Data域。
B+树更适合用来存储外部数据，也就是所谓的磁盘数据。

那么Mysql如何衡量查询效率呢？磁盘IO次数。B-树（B类树）的特点就是每层节点数目非常多，层数很少，目的就是为了就少磁盘IO次数，当查询数据的时候，最好的情况就是很快找到目标索引，然后读取数据，但是B-树的每个节点都有data域（指针），这无疑增大了节点大小，说白了增加了磁盘IO次数（磁盘IO一次读出的数据量大小是固定的，单个数据变大，每次读出的就少，IO次数增多），而B+树除了叶子节点其它节点并不存储数据，节点小，磁盘IO次数就少。这是优点之一。

另一个优点是，B+树所有的Data域在叶子节点，一般来说都会进行优化，将所有的叶子节点用指针串起来。这样遍历叶子节点就能获得全部数据，这样就能进行区间访问了。

MongoDB使用B-树，所有节点都有Data域，只要找到指定索引就可以进行访问，单次查询平均快于Mysql（？）

7 Arrays.asList

List<String> list = Arrays.asList(arr);

Arrays.asList 没有实现add方法。所以以上述方式创建的List 不能使用add()方法。

Arrays.asList源代码：

    public static <T> List<T> asList(T... a) {
        return new ArrayList<>(a);
    }

new ArrayList<>(a) 是Arrays里面的一个静态内部类，继承了 AbstractList。在该 ArrayList 内部没有重写 add() 和 remove() 方法。

8 内存分配及变量存储位置

程序运行时，有六个地可以保存数据：
1、寄存器：这是最快的保存区域，位于处理器内部。寄存器的数量十分有限，所以寄存器是根据需要由编译器分配。没有直接控制权，在程序里也找不到寄存器存在的任何踪迹。
2、栈：存放基本类型的数据和对象的引用，但对象本身不存放在栈中，而是存放在堆中（new出来的对象）。驻留于常规RAM（随机访问存储器）区域。但可通过它的“堆栈指针”获得处理的直接支持。堆栈指针若向下移，会创建新的内存；若向上移，则会释放那些内存。这是一种特别快、特别有效的数据保存方式，仅次于寄存器。创建程序时，java编译器必须准确地知道堆栈内保存的所有数据的“长度”以及“存在时间”。这是由于它必须生成相应的代码，以便向上和向下移动指针。这一限制无疑影响了程序的灵活性，所以尽管有些java数据要保存在堆栈里——特别是对象句柄，但java对象并不放到其中。
3、堆：存放用new产生的数据。一种常规用途的内存池（也在RAM区域），其中保存了java对象。和堆栈不同：“内存堆”或“堆”最吸引人的地方在于编译器不必知道要从堆里分配多少存储空间，也不必知道存储的数据要在堆里停留多长的时间。因此，用堆保存数据时会得到更大的灵活性。要求创建一个对象时，只需用new命令编制相碰的代码即可。执行这些代码时，会在堆里自动进行数据的保存。当然，为达到这种灵活性，必然会付出一定的代价：在堆里分配存储空间时会花掉更长的时间
4、静态域：存放在对象中用static定义的静态成员。这儿的“静态”是指“位于固定位置”。程序运行期间，静态存储的数据将随时等候调用。可用static关键字指出一个对象的特定元素是静态的。但java对象本身永远都不会置入静态存储空间。
5、常量池：存放常量。常数值通常直接置于程序代码内部。这样做是安全的。因为它们永远都不会改变，有的常数需要严格地保护，所以可考虑将它们置入只读存储器（ROM）。
6、非RAM存储：硬盘等永久存储空间。若数据完全独立于一个程序之外，则程序不运行时仍可存在，并在程序的控制范围之外。其中两个最主要的例子便是“流式对象”和“固定对象”。对于流式对象，对象会变成字节流，通常会发给另一台机器，而对于固定对象，对象保存在磁盘中。即使程序中止运行，它们仍可保持自己的状态不变。对于这些类型的数据存储，一个特别有用的技艺就是它们能存在于其他媒体中，一旦需要，甚至能将它们恢复成普通的、基于RAM的对象。