一、顺序查找
- 通过下标,我们可以按照顺序来访问和查找具有线性或者顺序关系的数据项。
- 从列表的首项开始,按照下标增长的顺序,逐个比对数据项,如果到最后一个都未发现要查找的项,则查找失败
- 顺序查找的算法复杂度是O(n)
1.1 无序表
【代码】
def sequantialSearch(alist, item):
pos = 0
found = False
while pos < len(alist) and not found:
if alist[pos] == item:
found = True
else:
pos += 1
return found
testList = [1, 2, 34, 32, 5, 23, 8, 0]
print(sequantialSearch(testList, 23)) #True
print(sequantialSearch(testList, 534)) #False
1.2 有序表
- 数据项排了序: 若数据项不存在,比对可以提前结束
- 算法复杂度仍然是O(n)
【代码】
def sequantialSearch(alist, item):
pos = 0
found = False
stop = False
while pos < len(alist) and not found and not stop:
if alist[pos] == item:
found = True
else:
if alist[pos] > item:
stop = True
else:
pos += 1
return found
testList = [1, 2, 5, 8, 34, 32]
print(sequantialSearch(testList, 8)) #True
print(sequantialSearch(testList, 23)) #False
二、二分查找
利用有序表的特性,迅速缩小待比对数据项的范围
【步骤】
- 从列表中间开始比对
如果列表中间的项匹配查找项,则查找结束
如果不匹配,那么就有两种情况
- 列表中间项比查找项大,那么查找项只可能出现在前半部分
- 列表中间项比查找项小,那么查找项只可能出现在后半部分
无论如何,我们都会将比对范围缩小到原来的一半: n/2 - 继续采用上面的方法查找,每次把范围缩小一半
2.1 二分查找
- 二分法查找的算法复杂度是O(log n)
【代码】
def binarySearch(alist, item):
first = 0
last = len(alist) - 1
found = False
while first <= last and not found:
midpoint = (first + last)//2
#中间项比对
if alist[midpoint] == item:
found = True
else:
#缩小比对范围
if item< alist[midpoint]:
last = midpoint -1
else:
first = midpoint + 1
return found
testlist = [2, 4, 12, 24, 38, 49, 51]
print(binarySearch(testlist, 3)) #False
print(binarySearch(testlist,24)) #True
2.2 分而治之:递归算法
- 二分查找算法实际上体现了解决问题的典型策略: 分而治之
将问题分为若干更小规模的部分通过解决每一个小规模部分问题,并将结果汇总得到原问题的解 - 递归算法就是一种典型的分治策略算法, 二分法也适合用递归算法来实现
- 切片操作的复杂度是O(k),这样会使整个算法的时间复杂度稍有增加,也要考虑到对数据项进行排序的开销。所以, 在算法选择的问题上, 光看时间复杂度的优劣是不够的, 还需要考虑到实际应用的情况。
【代码】
def binarySearch(alist, item):
if len(alist) == 0:
return False
else:
midpoint = len(alist)//2
if item < alist[midpoint]:
return binarySearch(alist[:midpoint], item) #调用自身
else:
return binarySearch(alist[midpoint+1:],item)