ps: 极客时间,数据结构与算法之美的个人总结
一.如何实现随机访问
数组有两个特点
- 数组是一种线性表,元素是连续的,只有前后关系;
- 数组在内存中是连续的内存空间,存储同一种类型的数据。因此优缺点如下:
- 优点:随机访问,此时时间复杂度为O(1);
- 缺点:插入和删除操作需要搬移数据,耗性能。
元素存储的内存地址公式,数组随机访问正是通过如下公式支持。
a[i]_address = base_address + i * data_type_size.
纠错:“链表适合插入、删除,时间复杂度O(1);数组适合查找,查找时间复杂度为O(1)”。
- 数组即使排好序,使用二分查找也是O(logn)复杂度,正确表述:数组根据下标随机访问复杂度为O(1).
二.低效插入和删除操作
插入操作
- 最好时间复杂度:从末尾插入,O(1);
- 最差时间复杂度:从头插入,O(n);
- 平均时间复杂度:(1+ 2 +3 + …+ n)/ n = O(n)。
- 特殊情况,将插入位置的元素放在末尾,此时时间复杂度降到O(1).
删除操作
- 最好,最差,平均时间复杂度跟插入操作一样。
- JVM标记清除垃圾回收算法,先将要删除的元素先标记,然后一次性删除,避免多次搬移元素。
三.数组越界问题
C语言数组越界问题。
int main(int argc, char* argv[]){
int i = 0;
int arr[3] = {0};
for(; i<=3; i++){
arr[i] = 0;
printf("hello world\n");
}
return 0;
}
当i == 3 时,可能不停的循环下去。
四.容器是否完全取代数组
- 容器的优点是封装细节,提供很多方法直接使用,支持动态扩容,损失一点性能。Java 的容器不能装基本数据类型,开箱和装箱还会损失一部分性能。
- 数组性能好,用于底层的东西比较好。
总结:
- Java ArrayList无法存储基本类型,比如int、long,需要封装为Integer、Long类,而Autoboxing、Unboxing则有一定的性能消耗,所以如果特别关注性能,或者希望使用基本类型,就可以选用数组。
- 如果数据大小事先已知,并且对数据的操作非常简单,用不到ArrayList提供的大部分方法,也可以直接使用数组。
- 还有一个是我个人的喜好,当要表示多维数组时,用数组往往会更加直观。比如Object[][] array;而用容器的话则需要这样定义:ArrayList array。
五.解答标题
如果元素从1开始,那么公式为:
a[i]_address = base_address + (i - 1) * data_type_size. 多了一次减法指令。有历史的原因,Java沿袭c语言的作法,时间上也有语言不是从0开始,甚至可以为负数。