1. 基本概念
数据结构是一门研究如何有效组织数据,并提高数据处理效率的学科。通过研究各种数据内部的逻辑关系,使用某种特定的存储形式,并在此基础上对数据实施各种操作,这些工作被称为称为广义上的算法。
-
逻辑结构
- 指数据之间的内在关系。通常有集合、线性表、树、图等常见的逻辑结构。
- 逻辑结构是数据之间本身的属性,跟我们怎么处理它们无关。
-
存储形式
- 数据的存储方式。比如顺序存储、链式存储等。
- 不同的存储形式对最终数据的处理效率通常有很大的影响。
- 逻辑结构与存储形式并无必然联系。
2. 算法分析
算法分析是指算法在正确的情况下,对其优劣的分析。一个好的算法通常是指:
- 算法对应的程序所耗时间少
- 算法对应的程序所耗存储空间少
- 算法结构性好、易读、易移植和调试
数据结构与算法的本质任务,是提高程序的时间空间效率,简单讲就是让程序的执行速度越快越好,所需内存空间越少越好。虽然在很多情况下,程序的时空特性是相互制约的,就像鱼和熊掌不可兼得,但我们可以根据程序实际解决问题的侧重点,去平衡时间和空间的对性能的消耗。
2.1 时间复杂度
一般而言,时间复杂度并不考察一段代码运行所需要的绝对时间,因为不同的计算机的硬件参数不同,考察绝对时间没有意义。时间复杂度一般指的是代码的语句执行总次数,称为语句频度。比如:
void counting(int n)
{
for(int i=0; i<n; i++)
{
printf("本行语句将会出现n次\n");
for(int j=0; j<n; j++)
{
printf("本行语句将会出现n*n次\n");
}
}
}
在上述代码中,程序执行的语句频度理论是:
T
(
n
)
=
n
2
+
n
T(n) = n^2 + n
T(n)=n2+n
但一般情况下,我们只关心多项式的最高次幂,于是上述代码的时间复杂度我们表示为:
T
(
n
)
=
O
(
n
2
)
T(n)=O(n^2)
T(n)=O(n2)
这意味着,该程序算法所需要的时间,与传进来的参数n的平方成正比。
「课堂练习」
给定如下代码片段,估算它们运行的时间复杂度:
// 片段一:
for(int i=1; i<n; i*=2)
{
printf("i=%d\n", i);
}
// 片段二:
int i = 0;
int s = 0;
while(s < n)
{
++i;
s+=i;
}
// 片段三:
void bubble_sort(int data[], int n)
{
int k=0;
for(int j=0; j<n; j++)
{
for(int i=0; i<n-1-k; i++)
{
if(data[i] > data[i+1])
swap(&data[i], &data[i+1]);
}
k++;
}
}
不同算法的时间复杂度相差很大,如下图所示,随着所处理的问题规模的增大,不同时间复杂度的程序所需要的时间有天壤之别。
2.2 空间复杂度
空间复杂度的概念更简单一点,就是一段程序运行时所需的内存字节量。
2.3 时空复杂度互换
一段程序的性能指标,既要运行快速,又要节省内存,而通常这两者又是相互制约的,很难兼得。因此在实际解决问题时,会根据需要侧重一方,牺牲另一方。
「课堂练习」
给定一个 int 数据,要求尽快求出其二进制中 1 的位数。
提示:这是一道笔试题。这个问题的关键是要求“尽快”,可以考虑牺牲空间复杂度来换取时间复杂度。