Java面试题—基础题目
基础题目
1. Java线程的状态
Java线程在某个时刻只能处于以下六个状态中的一个。
- New(新创建),一个线程刚刚被创建出来,还没有开始运行的状态,更通俗点说:还没有调用start方法;
- Runnable(可运行),可以在Java虚拟机中运行的状态;一个可运行的线程可能正在运行自己的代码也可能没有,这取决于操作系统提供的时间片;
- Blocked(被阻塞),当一个线程试图获取一个内部的对象锁(不是java.util.concurrent库中的锁),而该锁此时正被其他线程持有,则该线程进入阻塞状态;
- Waiting(等待),当线程等待另一个线程通知调度器一个条件时,它自己进入等待状态。在调用Object.wait方法或Thread.join方法,或者是等待java.util.concurrent库中的Lock或Condition时,就会出现这种情况;
- Timed waiting(计时等待),Object.wait、Thread.join、Lock.tryLock和Condition.await等方法有超时参数,还有Thread.sleep方法、LockSupport.parkNanos方法和LockSupport.parkUntil方法,这些方法会导致线程进入计时等待状态,如果超时或者出现通知,都会切换会可运行状态;
- Terminated(被终止),因为run方法正常退出而死亡,或者因为没有捕获的异常终止了run方法而死亡。
参考资料:
- Java Platform SE 8文档
- Java核心技术 卷I—P634
2. 进程与线程的区别,进程间如何通讯,线程间如何通讯?
在并发编程领域,有进程和线程两个概念,在Java语言中说起并发编程,常常是指多线程,但是了解进程的概念也非常重要:
- 进程是操作系统的资源调度实体,有自己的内存地址空间和运行环境;
- 线程一般被称为轻量级的进程,线程和进程一样,也有自己的运行环境,但是创建一个线程要需要的资源比创建一个进程要少。线程存在于进程之中——每个进程至少有一个线程。一个进程下的多个线程之间可以共享进程的资源,包括内存空间和打开的文件。
- 进程跟程序(programs)、应用(applications)具备相同的含义,进程间通讯依靠IPC资源,例如管道(pipes)、套接字(sockets)等;
- 线程间通讯依靠JVM提供的API,例如wait方法、notify方法和notifyAll方法,线程间还可以通过共享的主内存来进行值的传递;
参考资料:
3. HashMap的数据结构是什么?如何实现的?和HashTable、ConcurrentHashMap的区别?
- 在Java 8中,HashMap的数据结构是由Node<K,V>作为元素组成的数组:(1)如果有多个值hash到同一个桶中,则组织成一个链表,而且,当这个链表的节点个数超过某个值(TREEIFY_THRESHOLD参数指定)时,则将这个链表重构为一个二叉树;(2)如果发现map中的元素个数超过了threshold,则进行空间扩容——二倍空间。
- HashMap和HashTable的数据结构和操作基本相同,区别是前者是非线程安全,并且HashMap接受value为null。
- ConcurrentHashMap和HashTable一样,都是线程安全的,但是区别是:HashTable每次操作都会锁住整个表结构——导致一次只能有一个线程访问HashTable对象,而ConcurrentHashMap不会,只会锁住某个节点,只有在涉及到size的操作时才会锁整个表结构。
- 参考资料:《Java并发编程实战》
4. Cookie和Session的区别
HTTP是无状态协议,但是在实际应用中有跟踪客户端状态的需求,Cookie和Session是两种不同的实现方案。
- Cookie保存在客户端,Session保存在服务端
- Cookie没有Session安全,侵入者可以通过分析客户端的cookie信息侵入网站;
- 使用Session存储重要信息,使用Cookie存储不那么重要的信息;
- 使用Session方案时,常常需要依赖Cookie传递SID的值,如果客户端禁用了Cookie,则转而采取URL重写技术(但是这种技术有安全风险);
- 参考资料:What is the difference between Sessions and Cookies in PHP?
5. 索引有什么用?如何建索引?
- 索引的作用:索引是一种数据结构,用于加快mysql获取数据的速度;
- 如何建索引?在使用InnoDB引擎的前提下讨论:(1)最左前缀原理:分析业务中的查询条件,区分度高的字段放在前面,尽量减少一条SQL的影响行数;(2)A+B可以代替A,A+B+C可以代替A+B,如果查询是A+C则只能使用到A列索引;
- 关于InnoDB的认识:InnoDB使用B+Tree作为存储数据结构,属于聚簇索引,每个辅助索引最后都会指向主键的值,每次查询两次;(4)由于聚簇索引的特性,建议在使用InnoDB引擎的时候,使用自增ID作为主键,不要使用随机的业务列作为主键。
- 参考资料
6. ArrayList是如何实现的,ArrayList和LinkedList的区别?ArrayList如何实现扩容?
- 可变数组实现了List接口的所有操作,功能上跟Vector相同,区别是Vector是线程安全的;
- 区别:LinkedList实现了List和Deque接口,一般称为双向链表;LinkedList在插入和删除数据时效率更高,ArrayList在查找某个index的数据时效率更高;LinkedList比ArrayList需要更多的内存;
- 关于可变数组的扩容策略,可以查看源码,不同的JDK实现不太一样,我这里使用JDK 8:首先尝试扩容为原来大小的1.5倍,如果newCapacity还不够大,则再扩大为minCapacity值;如果newCapacity比数组的规定最大容量还大,则根据minCapacity的值进行定夺,参见hugeCapacity方法。
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8
/**
* Increases the capacity to ensure that it can hold at least the
* number of elements specified by the minimum capacity argument.
*
* @param minCapacity the desired minimum capacity
*/
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
- 在代码中,如果预先知道需要增加大量元素,则可以提前对当前的可变数组调用ensureCapacity方法,可以避免多次递增的内存重新分配;
- 参考资料:
- Java 8 DOC-LinkedList
- Java 8 DOC-ArrayList
- JDK 1.8中ArrayList的源码
7. equals、hashcode等Object类中一些方法的讨论?
- 覆写equals方法的时候,也必须覆写hashcode方法;
- 编写equals方法后,检查是否符合:对称性、传递性、一致性、自反性和非空性
- 参考资料
8. 面向对象
- 三大特性
- 封装
- 继承
- 多态
9. JVM如何加载字节码文件?
虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。
Java语言中类的加载、连接和初始化过程都是在程序运行期间完成的,领Java具备高度的灵活性。
类加载的过程:加载、连接(验证、准备、解析)、初始化。
- 加载:通过一个类的名字获取此类的二进制字节流(PS:不限于从文件中读取);将这个字节流代表的静态存储结构转换为方法区的运行时结构(由具体的虚拟机自己定义);在内存中生成一个java.lang.Class对象,作为方法区这个类的各种数据结构的访问入口。
- 验证:文件格式验证、元数据验证(语义分析,类与类的继承关系等)、字节码验证(数据流和控制流分析)、符号引用验证(对类自身以外的信息进行匹配校验)
- 准备:正式为类变量分配内存并设置初始值,这里类变量指的是被static修饰的变量。例外:如果类字段是常量,则在这里会被初始化为表达式指定的值。
- 解析:将常量池内的符号引用替换为直接引用。符号引用:类似于OS中的逻辑地址;直接引用:类似于OS中的物理地址,直接指向目标的指针、相对偏移量或一个能间接定位到目标的句柄。
- 初始化:真正开始执行类中定义的Java程序代码;初始化用于执行Java类的构造方法。类初始化的过程是不可逆的,如果中间一步出错,则无法执行下一步,参见不可逆的类初始化过程。
10. GC算法
- 垃圾回收解决三个问题:哪些内存需要回收?什么时候回收?如何回收?
- 垃圾回收关注的是堆内存(heap);
- 常见的垃圾收集算法
- 标记-清除算法
- 复制算法
- 标记-整理算法
- 分代收集算法
11. 什么情况下回出现Full GC,什么情况下会出现Young GC
- 对象优先在新生代Eden区中分配,如果Eden区没有足够的空间时,就会触发一次young gc
- Full gc的触发条件有多个,FULL GC的时候会STOP THE WORD。
- 在执行Young gc之前,JVM会进行空间分配担保——如果老年代的连续空间小于新生代对象的总大小(或历次晋升的平均大小),则触发一次full gc。
- 显式调用System.gc()方法时;
- 大对象直接进入老年代,从年轻代晋升上来的老对象,尝试在老年代分配内存时,但是老年代内存空间不够;
12. JVM内存模型
- Java虚拟机规范定义Java内存模型,尝试屏蔽掉各种硬件和操作系统的访问差异;
- JVM内存模型的目标:定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存取出来这样的细节;
- volatile关键字:当一个变量用volatile关键字限定后,会有两个语义:(1)当这个变量的值被修改后,会立即刷新到主内存中,对其他线程可见;当某个线程读取这个变量的时候,也会重新将主内存中的数据刷一份到工作内存中来。但是,如果多线程操作这个变量的计算中,后一个值依赖前一个值,就还是会有并发问题,说明volatile不具备原子性;(2)禁止指令重排优化,观察voatile变量对应的字节码文件,会发现变量的操作指令后面加了一句
lock addl $0x0,(%esp)
的操作,这个操作相当于一个内存屏障。 - synchronized关键字:当一个线程对一个变量加锁的时候,就会清空这个变量在当前工作内存中的值,因此该关键字同时满足了可见性和原子性。
- 参考资料
- 程晓明:深入理解JVM内存模型1
- 《深入理解JVM虚拟机》
- 《Java并发编程实战》
13. Java运行时数据区
- 程序计数器(PC):Java线程私有,类似于操作系统里的PC计数器,用于指定下一条需要执行的字节码的地址;
- Java虚拟机栈:Java线程私有,虚拟机展描述的是Java方法执行的内存模型:每个方法在执行的时候,都会创建一个栈帧用于存储局部变量、操作数、动态链接、方法出口等信息;每个方法调用都意味着一个栈帧在虚拟机栈中入栈到出栈的过程;
- 本地方法栈:和Java虚拟机栈的作用类似,区别是该该区域为JVM调用到的本地方法服务;
- 堆(Heap):所有线程共享的一块区域,垃圾收集器管理的主要区域。目前主要的垃圾回收算法都是分代收集,因此该区域还可以细分为如下区域:
- 年轻代
- Eden空间
- From Survivor空间1,From Survivor空间2,用于存储在Young gc过程中幸存的对象;
- 老年代
- 年轻代
- 方法区:各个线程共享的一个区域,用于存储虚拟机加载的类信息、常量、静态变量等信息;
- 运行时常量池:方法区的一部分,用于存放编译器生成的各种字面量和符号引用;
14. 事务的实现原理
- 事务的特性:ACID——原子性、一致性、隔离性和持久性
- Spring中的事务管理?Spring事务管理那些事
- MySQL中的事务?事务的隔离级别和锁,参考何登成的MySQL的加锁处理分析