1.算法效率
如何衡量算法的好坏?
这里需要引入算法的复杂度
1.2算法的复杂度
算法在编写成可执行程序后,运行时需要耗费时间资源和空间 ( 内存 ) 资源。因此 衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的 , 即时间复杂度和空间复杂度 。时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间 。在计算机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
2.时间复杂度
2.1时间复杂度的概念
时间复杂度的定义:在计算机科学中, 算法的时间复杂度是一个函数 ,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知 道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例, 算法中的基本操作的执行次数,为算法的时间复杂度 。
即: 找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
例如:
// 请计算一下Func1中++count语句总共执行了多少次?
voidFunc1(intN)
{
int count=0;
for (int i=0; i<N ; ++i)
{
for (int j=0; j<N ; ++j)
{
++count;
}
}
for (int k=0; k<2*N ; ++k)
{
++count;
}
int M=10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
F(N)=N^2+2*N+10
大 O 符号( Big O notation ):是用于描述函数渐进行为的数学符号。推导大 O 阶方法:1 、 用常数1取代运行时间中的所有加法常数 。2 、在修改后的运行次数函数中, 只保留最高阶项。(决定结果项)3 、如果最高阶项存在且不是 1 ,则去除与这个项目相乘的系数(常数)。得到的结果就是大 O 阶。使用大 O 的渐进表示法以后, Func1 的时间复杂度为: O(N^2)
我们容易看出最高阶项N^2起决定性作用,因此保留它。
// 计算Func2的时间复杂度?
void Func2(int N)
{
int count = 0;
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
结果为 0(2N)去掉系数—O(N),因为系数对值的影响也是微乎其微的。
// 计算Func3的时间复杂度?
void Func3(int N, int M)
{
int count = 0;
for (int k = 0; k < M; ++ k)
{
++count;
}
for (int k = 0; k < N ; ++ k)
{
++count;
}
printf("%d\n", count);
}
结果为O(M+N),因为我们不知道M和N的大小关系(重要程度),因此不能去掉任意一方。
如果知道,那么
// 计算Func4的时间复杂度?
void Func4(int N)
{
int count = 0;
for (int k = 0; k < 100; ++ k)
{
++count;
}
printf("%d\n", count);
}
结果为O(1),常数次结果都写成O(1),即使常数为1万亿。(CPU运行速度足够快;数据类型的值有上限)
// 计算strchr的时间复杂度?(str字符数组中查找一个字符)
const char * strchr ( const char * str, int character );
while(*str)
{
}
有些算法的时间复杂度例如此例存在最好、平均和最坏情况:最坏情况:任意输入规模的最大运行次数 ( 上界 )平均情况:任意输入规模的期望运行次数最好情况:任意输入规模的最小运行次数 ( 下界 )例如:在一个长度为 N 数组中搜索一个数据 x最好情况: 1 次找到最坏情况: N 次找到平均情况: N/2 次找到时间复杂度是一个稳健保守的预期, 在实际中一般情况关注的是算法的 最坏 运行情况,所以数组中搜索数据时间复杂度为O(N)
// 计算冒泡排序BubbleSort的时间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
直接从冒泡排序的原理看:
第一次将最大的数移动到最右边需要比较n-1次,第二次n-2,第三次... ...,这是一个等差数列,用公式求n项和,为(N-1)*N/2,因此时间复杂度为O(N^2)。
// 计算二分(折半)查找BinarySearch的时间复杂度?
int BinarySearch(int* a, int n, int x)
{
assert(a);
int begin = 0;
int end = n-1;
// [begin, end]:begin和end是左闭右闭区间,因此有=号
while (begin <= end)
{
int mid = begin + ((end-begin)>>1);
if (a[mid] < x)
begin = mid+1;
else if (a[mid] > x)
end = mid-1;
else
return mid;
}
return -1;
}
二分查找的原理:
该数列是有序的,从中间位置开始查找,如果要找的值更大或更小,就缩小一半查找范围,缩小一次,下一次查找的数量就除2,那么除了多少次2就查找了多少次。
查找区域只剩一个值为最坏情况,假设查找x次,2^x=N,x=log2N。
只有以2为底求n的对数可以写成logN。
二分查找和暴力查找之间的效率差距是巨大的,二分查找的效率非常高,但限制在于每次插入删除都需要重新排序。
// 计算阶乘递归Fac的时间复杂度?
long long Fac(size_t N)
{
if(0 == N)
return 1;
return Fac(N-1)*N;
}
总结:递归调用是多次调用的次数的累加
从Fac(N)到Fac(0)进行了N-1次调用,O因此结果为O(N)。
// 计算斐波那契递归Fib的时间复杂度?
long long Fib(size_t N)
{
if(N < 3)
return 1;
return Fib(N-1) + Fib(N-2);
}
F(N)=2^0+2^1+2^2+2^3+... ...+2^(N-1)
=2^N-1
2^N
面试题
消失的数字
思路1:排序+遍历(下一个数不等于这一个数+1,这个数就是消失的数字)
时间复杂度:O(logN*N) (不符合)
思路2:0-N等差数列公式计算N项和-数组中值的和,就是消失的数字
时间复杂度:O(N)(符合)
思路3:单身狗(异或)
时间复杂度:O(N)(符合)
相同为0,相异为1,相同的数只要放在一块进行了异或,就为0,与顺序无关
那么将原数组和有缺失的数组放在一起异或,结果就为消失的数。
思路2实现:
//参数为数组指针和成员数量
int MissingNumber(int* nums, int numSize)
{
int N = numSize;
//求和公式求出N项和
int ret = N*(1 + N) / 2;
int i = 0;
for (i = 0; i < N; i++)
{
//减去数组中的成员
ret -= nums[i];
}
return ret;
}
思路3实现:
int MissingNumber(int* nums, int numSize)
{
int N = numSize;
//用来存放异或结果的容器
int x = 0;
//将原数组放进容器
for (int i = 0; i <= N; i++)
{
x ^= i;
}
//将有缺失的数组放进去一起异或
for (int i = 0; i < N; i++)
{
//得到缺失值
x ^= nums[i];
}
return x;
}
int main()
{
int arr[5] = { 0,1,2,4,5 };
int sz = sizeof(arr) / sizeof(arr[0]);
printf("%d\n", MissingNumber(arr, sz));
return 0;
}
3.空间复杂度
空间复杂度也是一个数学表达式,是对一个算法在运行过程中 额外临时占用存储空间大小的量度 。空间复杂度不是程序占用了多少 bytes 的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复杂度类似,也使用 大O渐进表示法 。注意: 函数本身运行时所需要的栈空间 ( 存储参数、局部变量、一些寄存器信息等 ) 在编译期间已经确定好了, 因此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定 。
例1:
// 计算BubbleSort的空间复杂度?
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
在这里额外申请了end,exchange,i 三块空间,为常数个,因此空间复杂度为O(1)。
// 计算Fibonacci的空间复杂度?
// 返回斐波那契数列的前n项
long long* Fibonacci(size_t n)
{
if(n==0)
return NULL;
long long * fibArray = (long long *)malloc((n+1) * sizeof(long long));
fibArray[0] = 0;
fibArray[1] = 1;
for (int i = 2; i <= n ; ++i)
{
fibArray[i] = fibArray[i - 1] + fibArray [i - 2];
}
return fibArray;
}
申请了 n+1个动态内存,抓大头空间复杂度就是O(N)。
// 计算阶乘递归Fac的空间复杂度?
long long Fac(size_t N)
{
if(N == 0)
return 1;
return Fac(N-1)*N;
}
n次递归调用需要计算n次的空间消耗,单个函数的空间复杂度是常数次O(1),n次就是O(n)。
// 计算斐波那契递归Fib的空间复杂度?
long long Fib(size_t N)
{
if(N < 3)
return 1;
return Fib(N-1) + Fib(N-2);
}
答案是O(N)而不是O(2^N)。
原因是时间是累积的,而空间是可以重复利用的;递归总是从最左边项往下递归的,当到达递归终点就往回传值,传一次值,函数空间就被释放一次,被释放的空间就被用于接下来的递归调用函数,递归一次的空间复杂度为O(1),最左边项递归到终点需要N次递归,空间复杂度为O(N),接下来的递归都是在重复利用释放的空间,不会再使用额外的空间。
用一个例子能够说明栈帧空间的复用
4.常见复杂度的对比
练习:
轮转数组
给定一个整数数组
nums
,将数组中的元素向右轮转k
个位置,其中k
是非负数。示例 1:
输入: nums = [1,2,3,4,5,6,7], k = 3 输出:[5,6,7,1,2,3,4]
解释: 向右轮转 1 步:[7,1,2,3,4,5,6]
向右轮转 2 步:[6,7,1,2,3,4,5]
向右轮转 3 步:[5,6,7,1,2,3,4]
示例 2:
输入:nums = [-1,-100,3,99], k = 2 输出:[3,99,-1,-100] 解释: 向右轮转 1 步: [99,-1,-100,3] 向右轮转 2 步: [3,99,-1,-100]进阶:
- 尽可能想出更多的解决方案,至少有 三种 不同的方法可以解决这个问题。
- 你可以使用空间复杂度为
O(1)
的 原地 算法解决这个问题吗?
法1:(时间复杂度过大)
法2:
额外申请一块空间,将n-k后面的待轮转数用strcpy拷贝到新空间数组的前面,将无需轮转的数跟随拷贝到待轮转数后面,最后将空间中的数组拷贝回原空间。
实现:
#include <string.h>
void rotate(int* nums, int numsSize, int k)
{
int n=numsSize;
//取模的原因是使k小于n,否则发生越界访问
k%=n;
int* tmp=(int*)malloc(sizeof(int)*n);
memcpy(tmp,nums+n-k,sizeof(int)*k);
memcpy(tmp+k,nums,sizeof(int)*(n-k));
memcpy(nums,tmp,sizeof(int)*n);
free(tmp);
tmp=NULL;
}
法3:(一般情况下难以想到)
实现:
#include <string.h>
void reverse(int* a,int left,int right)
{
while(left<right)
{
int tmp=a[left];
a[left]=a[right];
a[right]=tmp;
left++;
right--;
}
}
void rotate(int* nums, int numsSize, int k)
{
int n=numsSize;
k%=n;
reverse(nums,0,n-k-1);
reverse(nums,n-k,n-1);
reverse(nums,0,n-1);
}