1. 二分查找
二分查找是一种算法,其输入是一个有序的元素列表。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回None。二分查找的速度比简单查找快得多。
#二分查找函数代码
def binary_search(mylist,item):
'''传入列表与需要查找的值'''
low = 0 #最低位索引
high = len(mylist)-1 #最高位索引
while low <= high:
mid = (low+high) // 2 #用双斜杠去尾取整,求中间的索引
guess=mylist[mid] #猜测的值
#如果值猜对,返回索引
if guess == item:
return mid #返回元素位置
#如果猜的值大于需要查找的值,将查找最高位索引定位在mid-1处
elif guess > item:
high = mid - 1
#如果猜的值小于需要查找的值,将查找最低位索引定位在mid+1处
else:
low = mid + 1
return None
#测试
mylist = [1,3,5,7,9]
print(binary_search(mylist,3))
print(binary_search(mylist,6))
一般而言,对于包含n个元素的列表,用二分查找最多需要log2n步,而简单查找最多需要n步。
2. 大O表示法(算法的运行时间)
大O表示法是一种特殊的表示法,指出了算法的速度有多快。
❑ 算法的运行时间用大O表示法表示。
❑ 算法的速度指的并非时间,并非以秒为单位的速度,而是操作数的增速。
❑ 算法运行时间是从其增速的角度度量的。
❑大O表示法不考虑乘以、除以、加上或减去的数字。
大O表示法指的并非时间,不考虑常量,但有时候,常量的影响可能很大,对快速查找和合并查找来说就是如此。快速查找的常量比合并查找小,因此如果它们的运行时间都为O(n log n),快速查找的速度将更快。
2.1 五种大O运行时间。
❑ O(log n),也叫对数时间,这样的算法包括二分查找。
❑ O(n),也叫线性时间,这样的算法包括简单查找。
❑ O(n * log n),这样的算法包括第4章将介绍的快速排序——一种速度较快的排序算法。
❑ O(n2),这样的算法包括第2章将介绍的选择排序——一种速度较慢的排序算法。
❑ O(n! ),这样的算法包括接下来将介绍的旅行商问题的解决方案——一种非常慢的算法。
练习
使用大O表示法给出下述各种情形的运行时间。
1.1 假设有一个包含128个名字的有序列表,你要使用二分查找在其中查找一个名字,请问最多需要几步才能找到?
1.2 上面列表的长度翻倍后,最多需要几步?
1.3 在电话簿中根据名字查找电话号码。
1.4 在电话簿中根据电话号码找人。(提示:须查找整个电话簿。)
1.5 阅读电话簿中每个人的电话号码。
1.6 阅读电话簿中姓名以A打头的人的电话号码。这个问题比较棘手,它涉及第4章的概念。
答案
1.1 7步。
1.2 8步。
1.3 O(log n)。
1.4 O(n)。
1.5 O(n)。
1.6 O(n)。你可能认为,我只对26个字母中的一个这样做,因此运行时间应为O(n / 26)。需要牢记的一条简单规则是,大O表示法不考虑乘以、除以、加上或减去的数字。下面这些都不是正确的大O运行时间:O(n +26)、O(n - 26)、O(n * 26)、O(n / 26),它们都应表示为O(n)!为什么呢?如果你好奇,请翻到4.3节,并研究大O表示法中的常量(常量就是一个数字,这里的26就是常量)。
《算法图解》- Aditya Bhargava