目录
一、什么是数据结构
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合
二、什么是算法
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果
数据结构和算法的重要性:在笔试面试中会出现大量关于数据结构和算法题目。对于大部分程序员而言,在工作中不是必须的,但是你要找工作,特别是刚毕业参加校招的学生,想进入一些比较大的公司,是必须要学好算法的。
-------------------我是分割线------------------
三、算法效率
3.1 如何衡量一个算法的好坏
如何衡量一个算法的好坏呢?比如对于以下斐波那契数列:
测试代码:
#include<stdio.h>
int Fib(int n)
{
if (n > 2)
return Fib(n - 1) + Fib(n - 2);
else
return 1;
}
int main()
{
int a = Fib(50);
printf("%d\n", a);
return 0;
}
使用递归计算,代码虽然比较简洁,但其实是非常捞的,你会发现递归去计算第50个斐波那契数时都要跑半天。
斐波那契数列的递归实现方式非常简洁,但简洁一定好吗?那该如何衡量其好与坏呢?
-------------------我是分割线------------------
3.2 算法的复杂度
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源 。因此衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度和空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
四、时间复杂度
4.1 时间复杂度的概念
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度
测试例子:请计算一下Func1中++count语句总共执行了多少次?
测试代码:
void Func1(int N)
{
int count = 0;
for (int i = 0; i < N; ++i)
{
for (int j = 0; j < N; ++j)
{
++count;
}
}
for (int k = 0; k < 2 * N; ++k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
int main()
{
Func1(10);
return 0;
}
Func1 执行的基本操作次数 :F(N) = N * N + 2 * N + 10
- 如果N = 10 ,F(N) = 130
- N = 100 ,F(N) = 10210
- N = 1000 ,F(N) = 1002010
实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法
4.2 大O的渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号
推导大O阶方法:
- (1)用常数1取代运行时间中的所有加法常数。
- (2)在修改后的运行次数函数中,只保留最高阶项。
- (3)如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。
使用大O的渐进表示法以后,Func1的时间复杂度为O(N^2)
- 如果N = 10, F(N) = 100
- N = 100 ,F(N) = 10000
- N = 1000 ,F(N) = 1000000
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。
外有些算法的时间复杂度存在最好、平均和最坏情况:
- 最坏情况:任意输入规模的最大运行次数(上界)
- 平均情况:任意输入规模的期望运行次数
- 最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
- 最好情况:1次找到
- 最坏情况:N次找到
- 平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
-------------------我是分割线------------------
4.3 常见时间复杂度计算举例
(1)计算Func2的时间复杂度
void Func2(int N)
{
int count = 0;
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
分析:
Func2的时间复杂度函数为F(N) = (2N + 10)
使用大O渐近表示法:保留影响最大的一项、去掉系数则为O(N)
-------------------我是分割线------------------
(2)计算Func3的时间复杂度
void Func3(int N, int M)
{
int count = 0;
for (int k = 0; k < M; ++ k)
{
++count;
}
for (int k = 0; k < N ; ++ k)
{
++count;
}
printf("%d\n", count);
}
分析:
Func3的时间复杂度函数为F(N) = (M + N)
使用大O渐近表示法:不一定只有一个未知数,所以这里可以写O(M + N)
也可以写成如下:O(max(M, N)):取M和N的较大值
O(M):如果能说明M远大于N,比如 M 是一百万,N是100
O(N):如果能说明N远大于M,比如 N是一百万,M是100
O(N)/O(M):M和N差不多大,取哪个都行
-------------------我是分割线------------------
(3)计算Func4的时间复杂度
void Func4(int N)
{
int count = 0;
for (int k = 0; k < 100; ++k)
{
++count;
}
printf("%d\n", count);
}
分析:
Func4的时间复杂度函数为F(N) = (100)
使用大O渐近表示法:使用1代表常数,所以O(1)
-------------------我是分割线------------------
(4)计算BubbleSort的时间复杂度
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
这是冒泡排序的一个优化版本,在一趟排序的过程中如果没有交换数据的话,它就会跳出循环,所以它是有最好、平均、最坏的情况的
BubbleSort的时间复杂度函数为F(N) = (n + (n - 1) + (n - 2) … + 2 + 1)
所以你会发现这是一个等差数列,利用公式整合得:F(N) = (n + 1)* n / 2 -> F(N) = n^2 / 2 + n / 2
使用大O渐近表示法:
- (最坏情况):O(N^2) -> 这是我们要考虑的情况,显然如果是最坏的情况,那我们就优化了个寂寞
- (平均情况):O(N^2) -> (n^2 / 2 + n / 2)/2
- (最好情况):O(N)
-------------------我是分割线------------------
(5)计算BinarySearch的时间复杂度
int BinarySearch(int* a, int n, int x)
{
assert(a);
int begin = 0;
int end = n-1;
while (begin < end)
{
int mid = begin + ((end-begin)>>1);
if (a[mid] < x)
begin = mid+1;
else if (a[mid] > x)
end = mid;
else
return mid;
}
return -1;
}
分析:
BinarySearch依然存在最好、平均、最坏的情况:
BinarySearch的时间复杂度函数为F(N) = N / 2 / 2 / 2 … /2 = 1
使用大O渐近表示法:O(log₂N)或O(logN) -> 因为底数不好打出来,有时候一般也这样写
- 1、N / 2
- 2、N / 2 / 2 -> N / 4:N / 2^2
- 3、N / 2 / 2 / 2 -> N / 8:N / 2^3
- x、N / 2^x = 1 -> N = 2^x -> log₂N = x
注:后面为了方便,以2为底的对数都简写成 logN
-------------------我是分割线------------------
(6)计算阶乘递归Fac的时间复杂度
long long Fac(size_t N)
{
if(1 == N)
return 1;
return Fac(N-1)*N;
}
分析:
Fac的时间复杂度为F(N) = (N)
使用大O渐近表示法:O(N)
-------------------我是分割线------------------
(7)计算斐波那契递归Fib的时间复杂度
long long Fib(size_t N)
{
if(N < 3)
return 1;
return Fib(N-1) + Fib(N-2);
}
分析:
2^0 + 2^1 + 2^2 + 2^3 … +2^(N-3) + 2^(N-2)
通过计算分析发现基本操作递归了2^N次,时间复杂度为O(2^N)
-------------------我是分割线------------------
五、空间复杂度
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度
空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复杂度类似,也使用大O渐进表示法
注意:
函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定
计算空间复杂度相对简单一些
例子:
(1)计算BubbleSort的空间复杂度
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
分析:
相比时间复杂度来说:时间是累计的,但空间不是累计的(可以重复利用)
BubbleSort的空间复杂度为F(N) = (3)
使用大O渐近表示法:O(1)
使用了常数个额外空间,所以空间复杂度为 O(1)
-------------------我是分割线------------------
(2)算Fibonacci的空间复杂度
// 返回斐波那契数列的前n项
long long* Fibonacci(size_t n)
{
if(n==0)
return NULL;
long long * fibArray = (long long *)malloc((n+1) * sizeof(long long));
fibArray[0] = 0;
fibArray[1] = 1;
for (int i = 2; i <= n ; ++i)
{
fibArray[i] = fibArray[i - 1] + fibArray [i - 2];
}
return fibArray;
}
分析:
动态开辟了N个空间,空间复杂度为 O(N)
-------------------我是分割线------------------
(3)计算阶乘递归Fac的空间复杂度
long long Fac(size_t N)
{
if(N == 0)
return 1;
return Fac(N-1)*N;
}
分析:
递归调用了N次,开辟了N个栈帧,每个栈帧使用了常数个空间。空间复杂度为O(N)
-------------------我是分割线------------------
六、常见复杂度对比
一般算法常见的复杂度如下
七、复杂度的oj练习
(1)消失的数字OJ链接:https://leetcode-cn.com/problems/missing-number-lcci/
int missingNumber(int* nums, int numsSize)
{
int i = 0;
int sum1 = 0;
int sum2 = 0;
for(i = 0; i < numsSize; i++)
{
sum1 += nums[i];
}
for(i = 0; i <= numsSize; i++)
{
sum2 += i;
}
return sum2 - sum1;
}
(2)旋转数组OJ链接:https://leetcode-cn.com/problems/rotate-array/
void rotate(int* nums, int numsSize, int k)
{
k = k % numsSize;
int left = 0;
int right = numsSize - 1;
int n = k - 1;
while (left < right)
{
int tmp = nums[left];
nums[left] = nums[right];
nums[right] = tmp;
left++;
right--;
}
left = 0;
while (left < n)
{
int tmp = nums[left];
nums[left] = nums[n];
nums[n] = tmp;
left++;
n--;
}
right = numsSize - 1;
while (k < right)
{
int tmp = nums[k];
nums[k] = nums[right];
nums[right] = tmp;
k++;
right--;
}
}
-------------------我是分割线------------------
推荐两个刷题网站:
力扣https://leetcode.cn/
-------------------我是分割线------------------
最后,也是最重要的:
算法的学习不只是理论的支持,更需要你不断的在理论的基础上去code,去思考。
文章就到这里