1. 为啥要学数据结构?
- 应用:机器学习,数据挖掘,自然语言处理,密码学,计算机图形学
- 研究:时空复杂度问题
- 找工作常用:贪心,分治,动态规划,树,图
2.什么是算法?
把大象装进冰箱分为几步?打开冰箱门,把大象放进去,关上冰箱门。没错,这是一个算法。
算法的条件:
- 又穷性(在人类毁灭前算完)
- 确定性(你好漂亮,我有点喜欢你。计算机:这TM怎么衡量)
- 可行性(人类能做的到的)
- 输入&输出
3.常用的算法
- 穷举(万能算法)
俗称暴力破解 - 分而治之(减而治之)
二分查找——减而治之
归并查找——分而治之 - 贪心
最小生成树Prim,Kruskal
单源最短路Dijkstra - 动态规划
背包
士兵路径
4.复杂度
谈算法不谈复杂度==耍流氓
使用大O记号(最坏情况,忽略系数)
时间:基本操作次数(汇编指令条数)
空间:占用内存字节数
区别:空间可以再利用
时空互换(Hash表)
时间和空间权衡的艺术
常见复杂度
- O(1)
最快,例如基本运算,+,—,*,/,寻址等 - O(logn)
二分查找(看见log跟分治相关,默认以2为底,实际上不同底之间可以转换) - O(n^(1/2))
枚举约数 - O(n)
线性查找
如果算上输入的复杂度,则输入n个数的时间复杂度的下线为O(n) - O(n^2)
冒泡,选择排序 - O(n^3)
Floyd最短路 - O(nlog(n))
归并排序
快速排序的期望复杂度
基于比较的算法的下界 - O(2^n)
枚举全部的子集 - O(n!)
枚举全排列
总结
相对比较好的复杂度:O(1)< O(logn)< O(n)< O(nlog(n))
可能还可以优化的复杂度 :O(n^2)< O(n^3)< O(2^n)< O(n!)
常见的复杂度分析方法
输入输出
如果算上输入输出的复杂度,那么需要注意时间复杂度的下线循环次数
两次循环的复杂度至少为n^2
5.数据结构分类
wiki上给的常见数据结构的分类为:
- 数组(Array)
- 堆栈(Stack)
- 队列(Queue)
- 链表(Linked List)
- 树(Tree)
- 图(Graph)
- 堆(Heap)
- 散列表(Hash)
总结一下大概分为:
- 线性结构(栈,队列,链表,哈希表(散列表))
- 树和堆(二叉树等各种树,二叉堆等)
- 图
出了基本的各种结构之外,数据结构很普遍的一种体现方式就是排序算法了,掌握基本结构和排序算法也是入门数据结构与算法的第一步。
6.最大子数组
leetcode上的53题:
Find the contiguous subarray within an array (containing at least one number) which has the largest sum.
For example, given the array [-2,1,-3,4,-1,2,1,-5,4],
the contiguous subarray [4,-1,2,1] has the largest sum = 6.
第一种方法:暴力破解,枚举所有的情况
两重循环,时间复杂度O(n^2)
class Solution:
def maxSubArray(self, A):
sum_temp=0
maxSum=-2147483648
for i in range(len(A)):
for j in range(i,len(A)):
sum_temp+=A[j]
maxSum=max(maxSum,sum_temp)
sum_temp=0
return maxSum
第二种方法:问题转化:用一层循环解决问题
目标:Max(A[i]+A[i+1]+···+A[j])
定义:S[j]=A[0]+A[1]+····+A[j]
目标转换:Max(S[j]-S[i-1])
结果:将目标转换为一个减法的问题
时间复杂度O(n)
class Solution:
def maxSubArray(self, A):
si=0 #前i项之和(因为sj先加,所以准确来讲每次循环使用的是前i-1项之和)
sj=0 #前j项之和
minsi=0 #应减去的前i-1项
ans=-2147483648 #int中最大的负数
for i in range(len(A)):
sj+=A[i]
if minsi > si :
minsi=si
if sj-minsi>ans: #极端:1.如果加上一个负数ans不变,2.开始第一个为负数,后面可以减去
ans = sj-minsi
si+=A[i]
return ans
为了更好的理解这种方法的可行性,取两个极端的例子试一下:
A=[-2,1,2,3,4]
sj先是等于-2,而后si=-2,ans=-2
sj=-2+1,minsi=-2,然后发现如果不加前面的-2,ans会更大,所以减去minsi,ans=1
如此一来就减去了前面的-2对最大值的负影响A=[1,2,3,4,-2]
sj=1+2+3+4后,minsi=0,循环结束时si=1+2+3+4,ans=1+2+3+4
当sj+-2后,发现sj-minsi不大于ans,所以ans不变
上述是一个简单的数据结构与算法的例题,可见问题的转化可以很大程度的简化处理问题所需复杂度,这也是数据结构可爱之处。