一、什么是数据结构
- 数据结构是相互之间存在一种或多种特定关系的数据元素的集合。
- 数据是信息的载体,是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。
- 数据元素是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理。
- 数据项:一个数据元素可以有若干个数据项组成,数据项是数据不可分割的最小单位。
- 数据对象是性质相同的数据元素的集合,是数据的子集。
- 数据结构主要强调两个方面的内容,一是数据之间的关系,二是针对这些关系的基本操作。
二、逻辑结构和物理结构
数据结构可以分为逻辑结构和物理结构。
1.逻辑结构
逻辑结构是数据对象中数据结构之间的相互关系,与数据是怎么存储的无关,是独立于计算机的。逻辑结构分为下列四种:
- 集合结构:结合结构中的数据元素除了属于同一集合外,他们之间没有其他关系。
- 线性结构:线性结构中的数据元素之间是一对一的关系。
- 树形结构:树形结构中的数据元素之间存在一种一对多的层次关系。
- 图形结构:图形结构的数据元素之间是多对多的关系。
2.物理结构
物理结构是指数据的逻辑结构在计算机中的存储形式,因此也成为存储结构。存储结构除了存储数据元素之外,还必须显式或隐式地存储数据元素之间地逻辑关系。物理结构分为以下两种:
- 顺序存储结构:是把数据元素存储到地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
- 链式存储结构:是把数据元素存储在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的,借助指示数据元素存储地址的指针表示数据元素之间的逻辑关系。
3.数据类型
1.原子类型:不可以再分解的基本数据类型,包括整型、字符型等。
2.结构类型:由若干个类型组合而成,是可以再分解的,如整形数组是有若干个整型数据组成的。
三、算法
1.一个例子认识算法
用代码求1+2+3+4+…+99+100.
在学算法之前最容易想到的方法如下:
int i,sum=0,n=100;
for(i = 1;i <= n; i++)
{
sum = sum + i;
}
printf("%d",sum);
换一种方法实现:
int i,sum = 0,n = 100;
sum = (1 + n) * n / 2;
printf("%d",sum);
相比之下,第二种方法更佳,这就是算法的魅力!
2.算法的概念
算法是对特定问题求解步骤的一种描述,是为了解决一个或一类问题而给出的一个确定的、有限长的操作序列。
3.算法的特性
- 有穷性
- 确定性
- 可行性
- 有输入
- 有输出
4.设计要求
- 正确性
- 可读性
- 健壮性
- 时间效率高和存储量低
5.算法效率的度量方法
(1)事后统计方法
这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序运行时间进行比较,从而确定算法效率的高低。简单理解就是看运行时间。但这种方法的缺陷很大,用的较少。
(2)事前分析估算方法
在计算机程序编制前,依据统计方法对算法进行估算。
一个用高级程序语言编写的程序在计算机上运行是所消耗的时间取决于下列因素:
- 算法采用的策略、方法
- 编译产生的代码质量
- 问题的输入规模
- 机器执行指令的速度
我们在分析一个算法的运行时间时,重要的是把基本操作的数量与输入规模关联起来,即基本操作的数量必须表示成输入规模的函数。
例:假设两个算法的输入规模都是n,算法A要做2n+3次,算法B要做3n+1次,问哪个算法更优?
其实很容易理解,要判断哪个算法更优要看n的值,即要看在什么输入规模下,在不同的输入规模下,算法实际操作数据会不同。
6.算法时间复杂度
(1)算法时间复杂度定义
在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间度量,记作:T(n)=O(f(n))。它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐进时间复杂度,简称时间复杂度。其中f(n)是问题规模n的某个函数。
(2)推导大O阶方法
a.用常数1取代运行时间中的所有加法常数
b.在修改后的运行次数函数中,只保留最高阶项
c.如果最高阶项存在且不是1,则去除与这个项相乘的常数,得到的结果就是大O阶
(3)常数阶
int i,sum = 0,n = 100; /* 执行一次 */
sum = (1 + n) * n / 2; /* 执行一次 */
printf("%d",sum); /* 执行一次 */
这个算法的执行次数f(n) = 3,时间复杂度是O(1)而不是O(3)。
(4)线性阶
下面这段代码的时间复杂度为O(n):
int i;
for(i=0;i<n;i++)
{
/* 时间复杂度为O(1)的程序步骤序列 */
}
(5)对数阶
int count = 1;
while(count < n)
{
count = count * 2;
/* 时间复杂度为O(1)的程序步骤序列 */
}
由于每次cout乘以2之后,就距离n更近了一分。也就是说,有多少个2相乘后大于n,则会退出循环。由2^x =n,得到x = log2n,所以这个循环的时间复杂度是O(logn)。
(6)平方阶
int i,j;
for(i = 0; i < n; i++)
{
for(j = 0; j < n ; j++)
{
/* 时间复杂度为O(1)的程序步骤序列 */
}
}
内部这个时间复杂度为O(n)的语句,再循环n次,所以这段代码的时间复杂度为O(n^2)。
如果外部循环的次数改为m,则时间复杂度就变成了O(n*m)。
7.算法的空间复杂度
算法的空间复杂度通过计算算法所需要的存储空间实现,算法空间复杂度的计算公式记作:S(n)=O(f(n)),其中,n为问题的规模,f(n)是语句关于n所占用存储空间的函数。
在写代码时,可以通过空间来换取时间。