什么是数据结构
数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。
数据元素:是数据的基本单位,在计算机中通常作为一个整体进行考虑和处理。在有些情况下,数据元素也称为元素、结点、记录等。数据元素用于完整地描述一个对象,如一个学生记录,树中棋盘的一个格局(状态)、图中的一个顶点等。
数据项:是组成数据元素的、有独立含义的、不可分割的最小单位。例如,学生基本信息表中的学号、姓名、性别等都是数据项。
什么是算法
算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一个或一组值作为输出。简单来说算法就是一系列的计算步骤,用来将输入数据转化成输出结果。
时间复杂度
1.时间复杂度的概念
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间。一个算法执行所耗费的时间,从理论上说,是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道。但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,所以才有了时间复杂度这个分析方式。一个算法所花费的时间与其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
2.大O渐进表示法
//计算一下fun1 一共执行了多少次
void Func1(int N) {
int count = 0;
for (int i = 0; i < N ; ++ i)
{
for (int j = 0; j < N ; ++ j)
{
++count;
}
}
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
Fun1()一共执行的次数
F(N)= N^2+ 2*N+ M
N = 10 F(N) = 130
N = 100 F(N) = 10210
N = 1000 F(N) = 1002010
实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法。
大O符号(Big O notation):是用于描述函数渐进行为的数学符号
推导大O阶方法:
1、用常数1取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中,只保留最高阶项。
3、如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结就是大O阶
所以Fun1() 最终结果就是:O(N^2)
【这里说一下,博主自己认为这就像高数极限当中的无穷大,总是高阶在起作用,例如上面次数中N^2就属于最高阶】
通过上面我们会发现大O的渐进表示法去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数
另外有些算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界)
平均情况:任意输入规模的期望运行次数
最好情况:任意输入规模的最小运行次数(下界)
例如:在一个长度为N数组中搜索一个数据x
最好情况:1次找到
最坏情况:N次找到
平均情况:N/2次找到
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
常见时间复杂度算法举例
eg1:
void Func2(int N)
{
int count = 0;
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
printf("%d\n", count);
}
Fun2()= 2*N+10
根据方法2与方法3 所以它的时间复杂度是 : O(N)
eg2:
void Func3(int N, int M)
{
int count = 0;
for (int k = 0; k < M; ++ k)
{
++count;
}
for (int k = 0; k < N ; ++ k)
{
++count;
}
printf("%d\n", count);
}
Fun3 () =M + N
这个就很有意思了有些人可能会认为是 O(N) , 但是实际时间复杂度是O(M+N)
原因是: 不清楚M与N 谁更大一些(他俩是同阶的同阶应该相加),如果M >> N那么时间复杂度就是 O(N), M >> N同理。
eg3:
void Func4(int N)
{
int count = 0;
for (int k = 0; k < 100; ++ k)
{
++count;
}
printf("%d\n", count);
}
Fun4()=100
时间复杂度就是: O(1) 【对应方法一,O(1) 代表的意思是常数次,而不是一次】
eg4:
//函数的意思是在字符串里查找一个字符
const char * strchr ( const char * str, int character )
{
while(* str !='\0')
{
if(*str==character)
return str;
++str;
}
}
时间复杂度计算中,通常假设数组或者字符串给出的长度为 N ,面对这种情况,看最坏,默认时间复杂度最坏就是O(N)
eg5:
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
求冒泡排序的时间复杂度 ,它的时间复杂度就是 O(N^2)
BubbleSort=n-1 + n-2 +n-3 + … + 2 + 1 = n^2/2
以上的冒泡是升序排,按照最坏的情况 ,最大的数字交换到最后需要 n-1 次,以此类推
所以时间复杂度就是 O(N^2) ,系数忽略
eg6:
int BinarySearch(int* a, int n, int x) {
assert(a);
int begin = 0;
int end = n-1;
while (begin < end)
{
int mid = begin + ((end-begin)>>1);
if (a[mid] < x)
begin = mid+1;
else if (a[mid] > x)
end = mid;
else
return mid;
}
return -1;
}
最好的情况就是O(1)
最坏的情况:
二分查找相当于查找一次 /2 ,直到找到最终的需要的结果
1X2X2X2X2…=N;
N/2/2/2/2/2/2…=1;
找了x次就除了2 x次
2^x=N
N=log2N (log以2为底N的对数)
所以它的时间复杂度就是 O(log2N) 【时间复杂度里习惯吧log2N写作 logN】
eg7:
// 计算阶乘递归Factorial的时间复杂度?
long long Factorial(size_t N)
{
return N < 2 ? N : Factorial(N-1)*N;
}
递归的时间复杂度=递归次数*每次递归函数中次数
可以看出递归函数中次数为1 ,只有一个三目运算符
N递归的次数为
F(N)
F(N-1)
F(N-2)
…
F(1)
一共递归了 N次 ,所以它的时间复杂度就是 O(N*1)
eg8:
// 计算斐波那契递归Fibonacci的时间复杂度?
long long Fibonacci(size_t N) {
return N < 2 ? N : Fibonacci(N-1)+Fibonacci(N-2);
}
递归函数中次数为 2 (三目运算与加法运算),可视为1
fibonacci(N)=fibonacci(N-1)+fibonacci(N-2)
递归的次数如下图:
所以递归的次数为2^n-1 ,时间复杂度为 : O(2^n)
但是这个算法的时间复杂度太高了,在实际中没有什么意义,建议直接改为循环,时间复杂度直接降为O(N)
优化如下:
#include<stdio.h>
int fib(int n)
{
if (n < 1)
{
return 0;
}
if (n == 1 || n == 2)
{
return 1;
}
int f1 = 1;
int f2 = 1;
int temp = 0;
for (int i = 3;i <= n;i++)
{
temp = f2;
f2 = f1 + f2;
f1 = temp;
}
return f2;
}
int main()
{
int n = 0;
scanf("%d", &n);
printf("%d\n", fib(n));
}
最后博主在提醒一下,时间复杂度与其函数所传值是无关的,就拿上述eg1所示不会因为将N传值为1(Fun(1))而改变它的时间复杂度。