主页:醋溜马桶圈-CSDN博客
目录
1.数据结构和算法
1.1什么是数据结构?
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合
数据结构和数据库是有区别的:
- 数据结构:在内存中管理数据
- 数据库:在磁盘中管理数据
内存和磁盘的区别(相对而言):
- 内存带电存储(临时存储),读取速度快
- 磁盘不带电存储(永久存储),读取速度慢
1.2 什么是算法?
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果
1.3 数据结构和算法的重要性
在校园招聘的笔试中:
当前校园招聘笔试一般采用Online Judge形式, 一般都是20-30道选择题,3-4道编程题。
2017腾讯校招笔试真题_Java工程师、C++工程师_牛客网 (nowcoder.com)
在校园招聘的面试中:
某应届生CVTE面试:
- 怎么计算一个类到底实例化了多少对象?
- 如果还有一个派生类继承了这个类,那么如何计算这两个类,各自实例化了多少对象?
- 你了解联合体和结构体吗?
- 如何测试一个机器是大端还是小端?
- 你了解队列和栈吗?
- 怎么用两个栈实现一个队列。
- 你使用过模版吗?
- 写一个比较两个数大小的模板函数。
- 你使用过容器吗?
- 判断两个链表是否相交。
- Vector和数组的区别。
- 你在学校里做的最满意的一个项目是什么?简述一下这个项目。
某应届生腾讯的面试:
- 自我介绍
- 学习STL具体是怎么开展的?
- 如果一款产品给你怎么检测内存泄露?
- 进程间通信方式,共享内存是怎么实现的,会出现什么问题,怎么解决?
- TCP为什么是可靠的?可靠是怎么保证的?为什么要三次握手?为什么三次握手就可以可靠?
- Http数据分包问题;
- Vector相关;
- Hashmap相关;
- 红黑树的原理、时间复杂度等;
- Memcpy和memmove的区别;
- 客户端给服务器发送数据,意图发送aaa,然后再发bbb,但是可能会出现aaabbb这种情况,如何处理?
- 游戏的邮件服务器中每天会有玩家频繁的创建邮件和删除邮件,海量数据、大小不一,会有哪些场景, 怎么存储,邮件是怎么到内存的?
- 写一道算法题
某应届生百度的面试:
- 手写五道题,三道编程题,一道数据库,一道linux
- 数据库的题两问
- 算法了解的如何,插入排序编程
- 说一下IP,TCP,ARP
- 内核是什么
- IP层主要功能
- map和set底层
- bootstrap的用法,html,html的全称
- 你觉得框架和库有啥区别
- 代码优化
- 哈希表
- shell脚本
- 快速排序思想
- 递归是什么
- 分治是什么,与递归区别是什么
- web平台是怎么做的
- linux命令
- 了解些什么前沿的技术,英语怎么样,了解过什么英语的文献
在未来的工作中:
学好算法对一个程序员来说是必须的吗?如果是,至少应该学到哪种程度? - 知乎 (zhihu.com)
1.4 如何学好数据结构和算法
- 死磕代码
- 注意画图和思考
2.时间复杂度和空间复杂度
2.1 算法效率
2.1.1 如何衡量一个算法的好坏
如何衡量一个算法的好坏呢?比如对于以下斐波那契数列:
long long Fib(int N)
{
if (N < 3)
return 1;
return Fib(N - 1) + Fib(N - 2);
}
斐波那契数列的递归实现方式非常简洁,但是简洁就一定好吗?那如何衡量其好与坏呢?
2.1.2 算法的复杂度
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源,因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间,在计算机发展的早期,计算机的存储容量很小,所以对空间复杂度很是在乎;但是经过计算机行业的快速发展,计算机的存储容量已经达到了很高的程度,所以我们如今已经不需要特别关注一个算法的空间复杂度
2.2 时间复杂度
2.2.1 时间复杂度的概念
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数(数学中的函数式),它定量描述了该算法的运行时间,一个算法执行所耗费的时间,从理论上来讲,是不能被算出来的,只有程序在机器上跑起来才能知道,但是上机测试很明显是有限的,所以才有了时间复杂度这个分析方式
一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度
我们举个例子:
估算一下Func1中++count语句总共执行了多少次?
void Func1(int N)
{
int count = 0;
for (int i = 0; i < N; ++i)
{
for (int j = 0; j < N; ++j)
{
++count;
}
}
for (int k = 0; k < 2 * N; ++k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
我们画图分析一下
Func1执行的基本操作次数:
F(N)=N*N+2*N+10
- N=10 F(N)=130
- N=100 F(N)=10210
- N=1000 F(N)=1002010
我们转化一下这个表达式,保留对它影响最大的项,即N*N
那这个表达式就变成了
F(N)=N*N
- N=10 F(N)=100
- N=100 F(N)=10000
- N=1000 F(N)=1000000
我们可以看到,N越大,后两项对结果的影响越小
所以时间复杂度为:O(N^2)
2.2.2 大O的渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
- 用常数1取代运行时间中的所有加法常数
- 在修改后的运行次数函数中,只保留最高阶项
- 如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶
使用大O的渐进表示法以后,Func1的时间复杂度为:
O(N^2)
- N = 10 F(N) = 100
- N = 100 F(N) = 10000
- N = 1000 F(N) = 1000000
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。
另外有些算法的时间复杂度存在最好、平均和最坏情况:
- 最坏情况:任意输入规模的最大运行次数(上界)
- 平均情况:任意输入规模的期望运行次数
- 最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
2.3 空间复杂度
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 。
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。 空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法。
注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
2.4 常见时间复杂度
一般算法常见的复杂度如下:
实例1
实例1基本操作执行了2N+10次,通过推导大O阶方法知道,时间复杂度为 O(N)
实例2
实例2基本操作执行了M+N次,有两个未知数M和N,时间复杂度为 O(N+M)
实例3
实例3基本操作执行了100次,通过推导大O阶方法,时间复杂度为 O(1)
实例4
实例4基本操作执行最好1次,最坏N次,时间复杂度一般看最坏,时间复杂度为 O(N)
实例5
实例5基本操作执行最好N次,最坏执行了(N*(N+1))/2次,通过推导大O阶方法时间复杂度一般看最坏,时间复杂度为 O(N^2)
实例6
实例6基本操作执行最好1次,最坏O(logN)次,时间复杂度为 O(logN)
ps:logN在算法分析中表示是底数为2,对数为N。有些地方会写成lgN。(建议通过折纸查找的方式讲解logN是怎么计算出来的)
二分查找的时间复杂度为 O(log2n),其中n表示元素的数量
这是因为每次查找都可以将待查找区间缩小一半
所以最坏情况下需要进行的比较次数为 log2n --- O(logN)
实例7
实例7通过计算分析发现基本操作递归了N次,时间复杂度为O(N)
实例8
实例8通过计算分析发现基本操作递归了2^N次,时间复杂度为O(2^N)
(建议画图递归栈帧的二叉树讲解)
2.5 常见空间复杂度
实例1
实例1使用了常数个额外空间,所以空间复杂度为 O(1)
实例2
实例2动态开辟了N个空间,空间复杂度为 O(N)
递归空间复杂度计算:也是空间累加,但是不同的是空间可以重复利用
实例3
实例3递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间
空间复杂度为O(N)