暑假来临,应该是最后一个暑假了,找了家公司实习,公司对实习生的要求不高,工作量也少,抽空来温习一下数据结构吧。这次看的是《大话数据结构》,感觉作者写作风格有趣,让我感觉很有兴趣去看。如果需要的话可以从我的网盘下载,下面附上网盘链接。链接:http://pan.baidu.com/s/1skK9TPr 密码:6078
首先来了解下一些基本概念。
基本概念
1.数据:是描述客观事实的符号,是计算机可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。
2.数据元素:是组成数据的、有一定意义的基本单位,在计算机中通常作为整理处理。也被称为记录。
3.数据项:一个数据元素可以由若干个数据项组成。数据项是数据不可分割的最小单位。
4.数据对象:是性质相同的数据元素的集合,是数据的子集。
5.数据结构:是相互存在一种或多种特定关系的数据元素的集合。
总的来说,数据是最大的项,数据包含数据对象,数据对象又包含数据元素,数据元素又包含数据项,而数据结构则表示这些数据元素之间有某种特定关系的集合。切记,数据项是不可分割的最小单位。
逻辑结构
逻辑结构:是指数据对象中数据元素之间的相互关系。
1.集合结构:集合结构中元素除了同属于一个集合外,它们之间没有其他关系。
2.线性结构:线性结构的数据元素之间是一对一的关系。
3.树形结构:树形结构中的数据元素之间存在一种一对多的层次关系。
4.图形结构:图形结构的数据元素是多对多的关系。
物理结构
物理结构:是指数据的逻辑结构在计算机的存储形式。
1.顺序存储结构:是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
2.链式存储结构:是把数据存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的。
顺序存储结构是简单,死板的,就好比排队一样,一个接着一个。
而链式存储结构更加灵活,好比人类的关系网络,每个人之间都存在某种特定的联系,如六度分隔理论所说:你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。这样是否可以通过链式存储结构将人类庞大的关系网络设计存储起来,这个还有待实践。
看完了基本概念,我们要需要了解一下一些算法的知识,毕竟算法和数据结构就好比男女朋友,密不可分的嘛。
算法
算法:是解决特定问题求解步骤的描述,在计算机中表现为有限序列,并且每条指令表示一个或多个操作。
算法的特性:输入,输出,有穷性,确定性,可行性。
1.算法具有零个或多个输入,至少有一个或多个输出。
2.有穷性:指算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成。
3.确定性:算法的每一步骤都具有确定的含义,不会出现二义性。
4.可行性:算法的每一步都必须是可行的,也就是说,每一步都能通过执行有限次数完成。
算法设计要求:
1.正确性:算法的正确性是指算法至少应该具有输入、输出和加工处理无歧义性,能正确反映问题的需求、能够得到问题的正确答案。
2.可读性:算法设计的另一目的是为了方便阅读、理解和交流。
3.健壮性:当输入数据不合法时,算法也能作出相关处理,而不是产生异常或者莫名其妙的结果。
4.时间效率高,存储量低。
函数的渐近增长:给定两个函数f(n)和g(n),如果存在一个整数N,f(n)总是比g(n)大,那么我们说f(n)的增长渐近快于g(n)。于是我们可以得出一个结论,判断一个算法好不好,我们只通过少量的数据是不能做出准确的判断的,如果我们可以对比算法的关键执行次数函数的渐近增长性,就可以分析出:某个算法,随着n的变大,它会越来越优于另一算法,或者越来越差与另一算法。
算法时间复杂度:在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间度量,记作:T(n)=O(f(n))。它表示随着问题规模n的扩大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐近时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。
下面给出常见的时间复杂度所耗时间的大小排列:
O(1):常数阶,最小
O(log n):对数阶,次小
O(n):线性阶
O(n log n):n log n阶
O(n^2):平方阶
O(n^3):立方阶
O(2^n):指数阶
O(n!):n的阶乘,次大
O(n^n):n的n次幂,最大
下面给出推导大O阶的方法:
推导大O阶
1.用常数1取代运行时间中的所有加法常数
2.在修改后的运行次数函数中,只保留最高阶项。
3.如果最高阶项存在且不是1,则去除与这个项相乘的常数。
例1:下面这段代码的时间复杂度是多少呢?
int count = 1;
while (count < n){
count = count * 2;
}
每当进入循环,count就会乘以2,只要count>=n,则跳出循环。可以转化为有多少个2相乘之后的结果大于等于n, 得2^x = n, x = log n 。所以这个循环的时间复杂度就为O(log n)。
例2:来个复杂点的,这段代码的时间复杂度是多少呢
int i,j;
for(i = 0; i < n; i++){
for(j = i; j < n; j++){
.....
}
}
其实这是一个小学生的题目,执行次数就可以表达为从n加到1的总和,得n*(n+1)/2,f(n)=n*2/2 + n/2; 根据大O阶推导的方法,时间复杂度为O(n*2)。
很多同学,学了计算机专业,却始终弄不明白算法的时间复杂度估算,因为弄不清楚,也就很难深究自己写下的代码的效率,是不是可以通过优化使效率提高。虽然平时效率看起来似乎不是那么重要,但是对于养成良好的编程习惯,以及今后的编程之路确实十分重要。大家务必要掌握好,别问我为什么知道T-T。