手撕数据结构与算法-开篇

最新推荐文章于 2023-09-16 20:56:38 发布

晓双V

最新推荐文章于 2023-09-16 20:56:38 发布

阅读量701

点赞数

文章标签：算法 Java

本文链接：https://blog.csdn.net/qq_34264849/article/details/103289689

版权

1. 浪子回头

2019年，这个不平凡的一年，中美贸易战、各个大厂裁员。造成了现在互联网行情不好，形势很严峻啊。有的人说今年是互联网过去十年中最差的一年，也可能是未来十年中最好的一年。身处这样乱世的我们怎么办？我也听很多朋友说，今年的面试都比较严格，特点是"要求高、薪资低"。也经常听见他们说某某大厂考了个手写算法，结果当场挂了。身为程序员的我们，再这样行业形势严峻、竞争压力大的情况下，只有不断提升自身能力，以确保在行业内能有个立足之地。

《数据结构与算法》在我学生时代就是一门让我望而止步的课程。听着名字就感觉很晦涩难懂、需要大量的数学知识做铺垫。相信很多人也都和我一样，上学的时候学的一知半解，到了工作以后也很少用到就不了了之了。但是它却成为了你面试、寻找好的平台的障碍。很多大厂都很看中程序员的基本功，所以在面试中算法就编程了常考题目，为什么呢？因为基础知识就像是一座大楼的地基，它能够决定你技术的高度与深度。所以一般大厂都是看中你有没有这个技术发展的潜力。("所以大家要夯实基本功了。")

在我看来后端程序员应该学的有三大基础知识"数据结构与算法"、"计算机系统"、"操作系统Linux"。在这个人人都必须要手撕算法的时代，彻夜难眠的我（纯属扯淡）决定带领大家一起学习三大基础知识，本次开篇系列是《手撕数据结构与算法》，每一个系列更完就会开启下一个系列，大家不要着急。

注意,注意前方高能======>(广告植入)

如果你对我的这个系列感兴趣可以关注我的公众号，带你走上”超神之路、拿高薪offer、当上技术专家、出任个大厂、迎娶白富美、走上人生巅峰，想想还有点小激动。” (请允许我吹个🐂)

来了来了他来了他带着二维码来了！！！

2. 数学知识复习

在我们系统的学习数据结构与算法之前，我们先简单的复习几个数学知识，相信大家也都忘的差不多了，是不是都学完了又还给老师了呢？嫑急，跟我一起来复习一下。

2.1. 指数

指数是幂运算aⁿ(a≠0)中的一个参数，a为底数，n为指数，指数位于底数的右上角，幂运算表示指数个底数相乘。当n是一个正整数，aⁿ表示n个a连乘。当n=0时，aⁿ=1。《百度百科》

指数：就是aⁿ中的n。
底数：就是aⁿ的a
幂运算：指数个底数相乘。

幂运算公式:

在这里插入图片描述

2.2. 对数

$ a^{x}=n$ 如果a的x次方等于N（a>0，且a不等于1），那么数x叫做以a为底N的对数（logarithm），记作 $x=log_{a}N$ 。其中，a叫做对数的底数，N叫做真数。《百度百科》

在计算机科学中，除非有特别的声明，否则所有的对数都是以2为底的。

公式：

$l o g A B = l o g A + l o g B$ ; A,B>0
$log_{A}B =\frac{log_{c}B}{log_{c}A}$ ; A,B,C > 0, a≠1

简单列了两个公式，大家看看就行了，知道一下啥是对数。

3. 时间复杂度

对于算法时间复杂度，可能有的朋友可能想了，不就是估算一段代码的执行时间嘛，我们可以搞个监控啊，看看一下每个接口的耗时不就好了，何必那么麻烦，还要分析下时间复杂度。但是这个监控属于事后操作，只有代码在运行时，才能知道你写的代码效率高不高，那么如何在写代码的时候就评估一段代码的执行效率呢，这个时候就需要时间复杂度来分析了。大家平常写代码可以结合时间复杂度和监控做好事前、事后的分析，更好的优化代码。

时间复杂度是衡量算法的时间度量，用来评估一段代码的效率，记作： $T (n) = O (f (n))$ ,它表示随着问题规模n的增大，算法执行时间的增长率和 $f (n)$ 相同。 $f (n)$ 是语句所执行时间函数。

3.1 大O表示法

因为渐进时间复杂度使用大写O来表示，所以也称大O表示法。例如: $O (f (n))$ 。

常见时间复杂度：

复杂度	非正式术语	例子
$O (1)$	常数阶	$12$
$O (l o g n)$	对数阶	$5log_{2}n+10$
$O (n)$	线性阶	$2 n + 3$
$O (n l o g n)$	nlogn阶	$2n+3log_{2}n+2$
$O(n^{2})$	平方阶	$3n^{2}$
$O(n^{3})$	立方阶	$2n^{3}+5$
$O(2^{n})$	指数阶	$2^{n}$

常见时间复杂度所耗费时间从小到大依次是：

$O (1)$ < $O (l o g n)$ < $O (n)$ < $O (n l o g n)$ < $O(n^{2})$ < $O(n^{3})$ < $O(2^{n})$

推导大O的方法：

用1取代运行时间中的所有常数。例如： $O(2n^{2})$ ==> $O(n^{2})$
在函数中只保留最高阶项。例如 $O(2n^{2})+O(n)$ ==> $O(2n^{2})$
如果最高阶项存在并且不是1，则去掉与之相乘的系数。例如： $O(2n^{2})$ ==> $O(n^{2})$

3.2 如何分析时间复杂度

$O (1)$
```
int i = 5;         /*执行一次*/
int j = 6;         /*执行一次*/
int sum = j + i;   /*执行一次*/
```
这段代码的运行函数应该是 $f (n) = 3$ ,用来大O来表示的话应该是 $O (f (n)) = O (3)$ ,但是根据我们的推导大O表示法中的第一条，要用1代替函数中的常数，所以 $O (3) = > O (1)$ ,那么这段代码的时间复杂度就是 $O (1)$ 而不是 $O (3)$ 。
$O (l o g n)$
```
int count = 1;             /*执行一次*/
int n = 100;               /*执行一次*/
while (count < n) {
    count = count * 2;     /*执行多次*/
}
```
这段代码为什么是logn呢？只有当count小于n的时候才会执行，并且每次count都乘以2，所以由 $2^{x}=n$ 得知

$x=log_{2}n$ ,去掉底数所以这段代码的复杂性就是 $O (l o g n)$ 。
$O (n)$
```
for (int k = 0; k < n; k++) {
    System.out.println(k);   /*执行n次*/
}
```
这段代码的执行次数会随着n的增大而增大，也就是说会执行n次，所以他的时间复杂度就是O(n)。
$O(n^{2})$
```
for (int k = 0; k < n; k++) {
   for (int l = 0; l < n; l++) {
      System.out.println(l);      /*执行了n*n次/
   }
}
```
这段输出l的值得代码对于内循环来讲它执行了n次，但是每个内循环对于外循环来讲又被执行了n次，所以这个输出l值得代码就被执行了n乘n次，也就是 $n^{2}$ ,所以这段代码的时间复杂度就是 $O(n^{2})$ 。

读到这里不知道大家学会了没有？其实分析一段代码的时间复杂度，就找到你代码中执行次数最多的地方，分析一下它的时间复杂度是什么，那么你整段代码的时间复杂度就是什么。以最大为准。

3.3 时间复杂度量级

    public int find(int[] arrays, int findValue) {
        int result = -1;                                /*执行一次*/
        int n = arrays.length;
        for (int i = 0; i < n; i++) {
            if (arrays[i] == findValue) {               /*执行arrays.length次*/
                result = arrays[i];
                break;
            }
        }
        return result;                                 /*执行一次*/
    }

我们来分析一下上边这个方法，这个方法的作用是从一个数组中查找到它想要的值。其实一个算法的复杂度还会根据实际的执行情况有一定的变化，就比如上边这段代码，假如数组的长度是100，里面存的是1-100的数。

最好情况时间复杂度

如果我在这个数组里面查找数字1，那么在它第一次遍历的时候就找到了这个值，然后就执行break结束当前循环，此时所有的代码只执行了一次，属于常数阶 $O (1)$ ，这就是最好情况下这段代码的时间复杂度。
最坏情况时间复杂度

如果我在这个数组里面查找数字100，那么这个数组就要被遍历一边才能找到并返回，这样的话这个方法就要受到数组大小的影响了，如果数组的大小为n，那么就是n越大，执行次数越多。属于线性阶 $O (n)$ ，这就是最坏情况下的时间复杂度。
平均情况时间复杂度

我们都知道最好、最坏时间复杂度都是在两种极端情况下的代码复杂度，发生的概率并不高，因次我们引入另一个概念“平均时间复杂度”。我们还看上边的这个方法，要查找个一个数有n+1中情况：在数组0 ~ n-1的的位置中和不再数组中，所以我们将所有代码的执行次数累加起来((1+2+3+…+n)+n),然后再除以所有情况n(n+1),就得到需要执行次数的平均值了。

在这里插入图片描述

但是这个平均复杂度没有考虑各自情况的发生概率，这里的n+1个情况，它们的发生概率是不一样的，所以还需要引入各自情况发生的概率再具体分析。findValue要么在1_{n中，要么不在1}n中，所以他们的概率都是 $\frac{1}{2}$ ,同时数据在1~n中的各个位置的概率一样为 $\frac{1}{n}$ ,根据概率乘法法则，findValue在1~n中的任意位置的概率是 $\frac{1}{2n}$ ,因此在上边推导的基础上需要在加入概率的的发生情况。

考虑概率的平均情况复杂度为：
在这里插入图片描述

这就是概率论中的加权平均值，也叫做期望值，所以平均时间复杂度全称叫：加权平均时间复杂度或者期望时间复杂度。平均复杂度变为 $O(\frac{3n+1}{4})$ ，忽略系数及常量后，最终得到加权平均时间复杂度为 $O (n)$ 。

4. 空间复杂度

算法的空间复杂度是对运行过程中临时占用存储空间大小的度量，算法空间复杂度的计算公式记作： $S (n) = O (f (n))$ ,n为问题规模， $f (n)$ 为语句关于n所占存储空间函数。由于空间复杂度和时间复杂度的大O表示法相同，所以我们就简单介绍下。

常见的空间复杂度从低到高是：

$O (1)$ < $O (n)$ < $O(n^{2})$

4.1 如何分析空间复杂度

$O (1)$
```
public static void intFun(int n) {
   var intValue = n;
   //...
}
```
当算发的存储空间大小固定，和输入的规模没有直接的关系时，空间复杂度就记作O(1),就像上边这个方法，不管你是输入10，还是100，它占用的内存都是4字节。
$O (n)$
```
public static void arrayFun(int n) {
   var array = new int[n];
   //...
}
```
当算法分配的空间是一个集合或者数组时，并且它的大小和输入规模n成正比时，此时空间复杂度记为 $O (n)$ 。
$O(n^{2})$
```
public static void matrixFun(int n) {
   var matrix = new int[n][n];
   //...
}
```
当算法分配的空间是一个二维数组，并且它的第一维度和第二维度的大小都和输入规模n成正比时，此时空间复杂度记为 $O(n^{2})$ 。

5. 总结

对于时间和空间的取舍，我们就要根据具体的业务实际情况而定，有的时候就需要牺牲时间来换空间，有的时候就需要牺牲空间来换时间，在现在这个计算机硬件性能飙升的时代，当然我们还是喜欢选择牺牲空间来换时间，毕竟内存还是有的，也不贵。并且可以提高效率给用户更好的体验。

什么是时间复杂度？

时间复杂度就是对算法运行时间长短的度量，用大O表示为 $T (n) = O (f (n))$ 。常见的时间复杂度从低到高的顺序是： $O (1)$ 、 $O (l o g n)$ 、 $O (n)$ 、 $O (n l o g n)$ 、 $O(n^{2})$ 。
什么是空间复杂度？

空间复杂度是对算法运行时所占用的临时存储空间的度量，用大O标识为 $S (n) = O (f (n))$ 。常见的空间复杂度从低到高的顺序是： $O (1)$ 、 $O (n)$ 、 $O(n^{2})$ 。

6. 参考

《数据结构与算法分析》
《大话数据结构》
《漫画算法》

能看到这里的朋友，相信你也对学习保持着一定的热情，觉得对你有帮助的话麻烦点个赞或在看以资鼓励吧，有什么问题欢迎留言或者关注我公众号进群交流。另外文章有理解错误、写错、说错的地方，希望大家指正，这是对我最大的帮助，谢谢大家。

晓双V

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
手撕数据结构与算法-开篇

1. 浪子回头2019年，这个不平凡的一年，中美贸易战、各个大厂裁员。造成了现在互联网行情不好，形势很严峻啊。有的人说今年是互联网过去十年中最差的一年，也可能是未来十年中最好的一年。身处这样乱世的我们怎么办？我也听很多朋友说，今年的面试都比较严格，特点是"要求高、薪资低"。也经常听见他们说某某大厂考了个手写算法，结果当场挂了。身为程序员的我们，再这样行业形势严峻、竞争压力大的情况下，只有不断提升...
复制链接

扫一扫