数组是什么:数组是一组线性表数据结构,它用一组连续的内存空间来存储一组具有相同类型的数据。
线性表:数据排成像线一样的结构,每个线性表上数据最多只有前后两个方向,链表、队列、栈也为线性表结构。
非线性表:二叉树、堆、图。非线性是指数据不是简单的前后对应关系。
为什么数组从0开始编号
数组下标准确来讲指的是“偏移”,例如数组a,数组a[0]表示偏移0个type_size位置即为首地址,数组a[k]表示偏移k个type_size位置,所以计算a[k]的地址公式为:
a[k]_address = base_address + k * type_size
若数组从1开始那公式就变成了
a[k]_address = base_address + (k-1) * type_size
对比两个公式发现数组从1开始计算比从0开始计算多了一个减一的操作,对于CPU来说就是多了一次减法指令,因而为了提高效率选择从0开始。
数组的删除操作效率较低,若要进行多次删除操作时可通过先标记要删除的数据,每次删除不是真正的删除,只是记录数据已被删除,等到数组没有更多空间存储数据时再触发一次真正的删除操作,这样可大大减少数据搬移。这个方法其实就是JVM 标记清除垃圾回收算法的核心思想。
JVM标记-清除算法:
大多数主流虚拟机采用可达性分析算法来判断对象是否存活,在标记阶段,会遍历所有 GC ROOTS,将所有 GC ROOTS 可达的对象标记为存活。只有当标记工作完成后,清理工作才会开始。清除之后会产生大量不连续的内存碎片。
不足:1.效率问题。标记和清理效率都不高,但是当知道只有少量垃圾产生时会很高效。2.空间问题。会产生不连续的内存空间碎片。
JVM标记-整理算法:
在标记完成之后让所有存活的对象都向一端移动,然后直接清理掉边界以外的内存。