地址 http://open.163.com/special/opencourse/algorithms.html
第一课 课程简介及算法分析
算法重要的原因
1. 直接决定着可行或是不可行。比如我们对于实时的需求,比如对内存的控制
2. 我们需要性能作为支付其他代价的“货币”,比如为了python简洁的语法和快速开发,我们要付出它比C慢的代价
一个古老的问题:排序
A = [2,6,4,8,9,3] 从小到大排序
- 插入排序:我们从给出数组的下标为1的元素开始,依次移动各个元素的位置,使这个元素出现在合适的位置
A = [2,5,4,7,3,9] for i in range(1, len(A)): # 假设0-i是已经排序好的,这里用了循环不定式的概念,即循环的第一次迭代前为真,且如果循环的某次迭代前为真,那么下次迭代前仍为真。有些类似于数学归纳法 key = A[i] j = i - 1 while j > 0 and A[j] > key: A[j + 1] = A[j] j -= 1 A[j + 1] = key
算法运行时间:
1. 给出的数组的排序情况
2. 输入的规模
3. 我们需要确认这个算法的运行时间的上界我们通常关注的是当输入规模为n时的最长运行时间,有时也会关注平均运行时间
T(n)定义为输入规模为n时的最长运行时间
渐进分析:忽略掉依赖机器的常量,不关注绝对的运行时间而去关注运行时间随n变化的增长
Θ(theta) 表示略去多项式中的低阶项及常数项
O表示渐进上界,Ω表示渐进下界
- 分治法
- 分解原问题为若干子问题,这些子问题都是原问题的规模较小实例
- 递归的求解各个子问题,当子问题规模足够小时,直接求解
- 合并子问题的解为原问题的解
- 归并排序
- if n == 1, done
- 递归的将n分解为[0, n/2]和[n/2 +1, n]两部分并排序
- 合并这排序好的两部分
在第二步分解的时候,我们可以把它看为分解成了一颗二叉树,这颗树的高是lgn,叶子节点的总数是n
def fast_sort(ori_list):
if ori_list:
if len(ori_list) != 1:
fast_value = ori_list[0]
else:
return ori_list
else:
return ori_list
left, right = [], []
for i in ori_list[1:]:
if i < fast_value:
left.append(i)
else:
right.append(i)
return fast_sort(left) + [fast_value] + fast_sort(right)
- 快速排序
使用了分治法的策略,复杂度不好说,但是可以在原地排序,节省了内存
def quick_sort(sort_list):
if len(sort_list) <= 1:
return sort_list
mark = sort_list[0]
i, j = 0, 1
for v in range(len(sort_list)-1):
if sort_list[j] < mark:
sort_list[i+1], sort_list[j] = sort_list[j], sort_list[i+1]
i += 1
j += 1
sort_list[0], sort_list[i] = sort_list[i], sort_list[0]
return quick_sort(sort_list[:i]) +[sort_list[i]] + quick_sort(sort_list[i+1:])
- 随机快速排序
在快速排序的时候,随机选择一个数作为主元,而不是像上面的快速排序一样选择list[0],然后需要做一些尾递归优化,这样可以使效率增加3倍左右。
证明过程没听懂,擦。
- fibonacci
fibonacci数列的递归形式每次只能把问题大小-1,复杂度却是指数倍上升,不推荐。
def recur_fibo(max_n):
n, a, b = 0, 0, 1
while n < max_n:
yield b
a, b = b, a + b
n += 1
for i in recur_fibo(5):
print i