前言
掌握数据结构与算法,提升编码能力与思维能力
一、为什么要学习数据结构和算法?
1.对于大部分的业务开发来说,可能更多的是利用类库来实现的,但是如果你不了解这些类库背后的数据结构和算法,不懂空间复杂度和时间复杂度,如何用好他们,用对他们;调用某个函数之后如何评估代码的性能与资源消耗;
2.业务开发用到的各种框架、中间件和底层系统,如MySQL、Spring、MQ和Redis等。其中都涉及到很多基础数据结构和算法思想。如Redis中,有序集合用什么数据结构实现?为什么要用跳表?为什么不用二叉树?mysql中索引为什么用B+树等等
若能清晰这些底层原理,就能更好利用它们。
二、什么是数据结构和算法
- 广义上,也就是从课本上说,数据结构就是一组存储数据的结构,而算法能就是操作数据的一组方法。
- 狭义上,其实是针对著名的数据结构与算法。著名的意思即前人的智慧结晶,我们时常听到的堆,栈,二分查找,快速排序等都是著名的数据结构与算法。站在巨人的肩膀上,我们能有更卓越的成就。
数据结构:数组、链表、栈、队列、散列表、二叉树、堆、跳表、图、 树
算法:递归、排序、二分查找、搜索、哈希算法、贪心算法、分治算法、回溯算法、动态规划、字符串匹配算法
三、算法的特性
五个特征:有穷性、确定性、可行性、有输入、有输出
设计原则:正确性、可读性、健壮性 bug:写出代码很少有bug,而且系统比较稳定
高效率 与低存储: 内存+CPU 堆栈内存OOM 内存占用最小,CPU占用最小,运算速度最快
四、 时间复杂度&空间复杂度
评价算法的两个重要指标:时间复杂度的计算 时间复杂度:运行一个程序所花费的时间。
空间复杂度:运行程序所需要的内存 OOM
时间复杂度
几种常见的时间复杂度分析:
- 常数:O(1) 1表示是常数,所有能确定的数字我们都用O(1),O(1000)=>o(1)
- 对数:O(logn),O(nlogn)
- 线性:O(n)
- 线性对数:O(nlogn)
- 平方:O(n^2)
- N次方:O(n^n)
学了时间复杂度,那我们的目的就是要把代码写到最优,效率最高;
时间复杂度的排序:O(1)>O(logn)>O(n)>O(nlogn)>O(n^2)
其中O(1)>O(logn)>O(n)>O(nlogn) 效果都是很好的。几乎优化的空间不是很大。
O(1):
只要循环是确定的,那么这段代码块的时间复杂度就是O(1)
for (int i = 0; i < 4; i++) { // 在第5次的时候结束
a = a + 1; //这里会运行4次 O(4) => O(1)
}
O(log(n)):
当数据增大 n 倍时,耗时增大 logn 倍(这里的 log 是以 2 为底的,比如,当数据增大 256 倍时,耗时只增大 8 倍,是比线性还要低的时间复杂度)。二分查找就是 O(logn)的算法,每找一次排除一半的可能,256 个数据中查找只要找 8 次就可以找到目标。
while (i <= n) {
i = i * 2; // O(logn)
}
O(n):
理解起来也很简单,就是算法的时间复杂度随着数据量的增大几倍,耗时也增大几倍。
常见的算法举例:遍历算法。
for(int i=0;i<n;i++){
a++;
}
O(nlog(n))
在复杂度为log(n)的循环外层再套一层循环,时间复杂度就是O(nlog(n))
for (int j = 0; j < n; j++) {
while (i <= n) {
i = i * 2;
}
}
O(n^2)
就代表数据量增大 n 倍时,耗时增大 n 的平方倍,这是比线性更高的时间复杂度。比如冒泡排序,就是典型的 O(n^2) 的算法,对 n 个数排序,需要扫描 n × n 次。
//(1)
for(i=1;i<=n;i++){
for(j=1;j<=n;j++){
s++;//循环了n*n次,当然是O(n^2)
}
}
//(2)
for(i=1;i<=n;i++){
for(j=i;j<=n;j++){
s++;//循环了(n+n-1+n-2+...+1)≈(n^2)/2,因为时间复杂度是不考虑系数的,所以也是O(n^2)
}
}
你除了以上的5种常见情况外,在工程开发中,往往会有着大量的网络IO交互,比如RPC远程服务调用、HTTP接口访问、访问数据库等,
空间复杂度
一般情况下,一个程序在执行时,除了寄存本身所用的指令、常数、变量、和输入数据之外,还需要对数据进行操作的辅助存储空间。算法的空间复杂度就是对其所需辅助空间量级的描述。
O(1)
算法仅需要借助一个变量t,与问题规模大小 n无关,其空间复杂度为O(1)。
int t = 0;
for(int i=0;i<n;i++){
t = i;
}
O(n)
算法需要另外借助一个空间大小为n的辅助数组b,其空间复杂度为O(n)。
for(int i=0;i<n;i++){
num[i] = i;
}
其他空间复杂度计算方式类似于时间复杂度的计算...