前言:
前面我们已经系统的学完C语言的相关知识,现在我们已经较为熟练的掌握了C语言中的各中代码语法和结构使用,能够使用代码来解决一些简单问题。但是对于一个程序员来说,仅仅会语法是远远不够的,从今天开始,我们将进入到数据结构的学习。
一、初始数据结构:
数据结构:
数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的 数据元素的集合。通常情况下,精心选择的数据结构可以带来更高的运行和存储效率。数据结构往往同高效的检索算法和索引技术有关。
2.算法:
算法(Algorithm):就是定义良好的计算过程,它取一个或一组的值为输入,病残生出一个或一组值作为输出。见来说算就是一系列计算步骤用来将输入数据转化为输出结果。
算法具有以下五个特点:
①有穷性: 指算法必须能在执行有限个步骤之后终止;
②确切性: 算法的每一个步骤必须有确切的定义;
③输入项: 一个算法有0个或者多个输入,以刻画运算对象的初始情况,所谓0个输入是指算法本身定出了初始条件;
④输出项: 一个算法有一个或多个输出,以反映对输入数据加工后的结果;
⑤可行性: 算法中执行的任何计算机步骤都是可以被分解为基本的可执行的操作步骤,即每个计算步骤都快要有限时间内完成。
常见的算法思想:递推法、递归法、穷举法、贪心算法、分治法、动态规划法、迭代法、分支界限法,回溯法。
二、算法效率:
算法的效率可以分为两种:时间效率和空间效率。
时间效率顾名思义就是指算法执行的时间,依据改算法编制的程序在计算机上运行时所消耗的时间来度量。空间效率指的是程序运行所需占用的空间,根据该算法编制的程序在计算机上运行时所占用的全部空间来度量。总而言之,算法效率其实就是为了研究算法的好坏而生的。而我们在衡量算法的好坏时,通常从时间和空间这两个角度出发的。从时间维度出发研究算法的时间复杂度,从空间维度出发研究算法的空间复杂度。
时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算 机发展的早期,计算机的存储容量很小。所以对空间复杂度很是在乎。但是经过计算机行业的迅速发展,计 算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注一个算法的空间复杂度。
时间复杂度:
时间复杂度的定义:在计算机科学中,算法的时间复杂度是一个函数,它定量描述了该算法的运行时间,一个算法执行所消耗的时间,从理论上讲是不能算出来的,只有你把你的程序放在机器上跑起来,才能知道,但是我们需要每个算法都上机测试吗?是可以都上机测试,但是这很麻烦,而且随着科技的发展,现在不同的电脑cpu差距很大,又可能在一个电脑跑10s的程序,到另一个电脑就需要15s了,所以才有了时间复杂的这个分析方式。一个算法所花费的时间于其中语句的执行次数成正比例,算法中的基本操作的执行次数,为算法的时间复杂度。
即:找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
例如:
/ 请计算一下Func1中++count语句总共执行了多少次?
void Func1(int N)
{
int count = 0;
for (int i = 0; i < N ; ++ i)
{
for (int j = 0; j < N ; ++ j)
{
++count;
}
}
for (int k = 0; k < 2 * N ; ++ k)
{
++count;
}
int M = 10;
while (M--)
{
++count;
}
上述代码中,第一部分的嵌套循环共执行了N的平方(N^2);第二部分的循环共执行了N*2次,第三部分共执行了10次,因此这段代码的时间复杂度F(N):
F(N)=N^2+N*2+10
也就是:
N = 10 F(N) = 130 N = 100 F(N) = 10210 N = 1000 F(N) = 1002010
但是在实际中,我们在计算时间复杂度时,并不一定要计算精确的执行次数(从上面的示例我们就可发现,随着N增大,时间复杂度与N*2+10的关系越来越小,时间复杂度取决于最高次幂N^2),而只需要大概执行次数就可以了,于是我们通常用大O的渐进表示法来表示算法的时间复杂度。
2.大O渐进表示法
大O符号(Big O notation):是用于描述函数渐进行为的数学符号。
推导大O阶方法:
1、用常数1取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中,只保留最高阶项。
3、如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶
例如上面的时间复杂度使用此方法表示为:O(N^2)。即通过使用此方法,去掉了那些对结果影响不大的项,简洁明了的表示出了执行次数。
另外有些算法的时间复杂度存在最好、平均和最坏情况:
最坏情况:任意输入规模的最大运行次数(上界) 平均情况:任意输入规模的期望运行次数 最好情况:任意输入规模的最小运行次数(下界) 例如:在一个长度为N数组中搜索一个数据x 最好情况:1次找到 最坏情况:N次找到 平均情况:N/2次找到
而在我们在实际中的一般情况下关注的是算法的最坏运行情况。
3.空间复杂度:
空间复杂度也是一个数学表达式,是对一个算法在运行过程中临时占用存储空间大小的量度 。 空间复杂度 不是程序占用了多少bytes的空间,因为对于如今的技术这个也没太大意义,所以 空间复杂度算的是变量的个数。 空间复杂度计算规则 基本跟时间复杂度类似,也使用大O渐进表示法。 注意:函数运行时所需要的栈空间(存储参数、局部变量、一些寄存器信息等)在编译期间已经确定好了,因 此空间复杂度主要通过函数在运行时候显式申请的额外空间来确定。
例如:
void BubbleSort(int* a, int n)
{
assert(a);
for (size_t end = n; end > 0; --end)
{
int exchange = 0;
for (size_t i = 1; i < end; ++i)
{
if (a[i-1] > a[i])
{
Swap(&a[i-1], &a[i]);
exchange = 1;
}
}
if (exchange == 0)
break;
}
}
在上述代码中,出去原本就存在的的量的空间外,额外定义的变量有end、i和exchange,共三个,则空间复杂度的表达式F(N)=3;其表达式为常数,大O表示为O(1);
总结:
今天是我们初识数据结构,到此我们对数据结构有了一个大致的了解,同时学会了计算算法的时间复杂度和空间复杂度,学会这两个我们就可以更加精确的优化我们的代码。
本文仍有许多不足,欢迎各位随时批评指正。