什么是搜索算法
搜索是在一个项目集合中找到一个特定项目的算法过程。搜索通常的答案是真的或假的,因为该项目是否存在。 搜索的几种常见方法:顺序查找、二分法查找、二叉树查找、哈希查找。
二分法查找
二分查找又称折半查找,优点是比较次数少,查找速度快,平均性能好;其缺点是要求待查表为有序表,且插入删除困难。因此,折半查找方法适用于不经常变动而查找频繁的有序列表。首先,假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;否则利用中间位置记录将表分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表。重复以上过程,直到找到满足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功。
二分法只查找顺序表,读取元素时间复杂度为o(1)的有序序列。像链表就不可以,因为二分法查找元素,主要是为了避免遍历序列中的所有元素来达到查找元素的目的,而链表本身找到对半位置的元素都是要通过遍历找到的(链表本身访问序列中的元素时间复杂度是o(n),不是o(1)),就达不到二分法查找的初衷。
二分法查找实现
1. 递归的方法实现
def binary_search(alist, item):
n = len(alist)
if 0 == n: #退出递归的条件
return False
mid = n // 2
if alist[mid] == item:
return True
elif item < alist[mid]:
return binary_search(alist[:mid], item)
else:
return binary_search(alist[mid+1:], item)
testlist=[0,1,2,13,15,44,53,77]
print(binary_search(testlist, 44))
print(binary_search(testlist, 20))
结果:
2. 非递归的方法实现
def binary_search(alist, item):
start = 0
end = len(alist) - 1
while start <= end: #当序列只有一个元素的时候
mid = (start + end) // 2
if alist[mid] == item:
return True
elif item < alist[mid]:
end = mid - 1
else:
start = mid + 1
return False #当退出循环没有返回True时说明没有找到
testlist=[0,1,2,13,15,44,53,77]
print(binary_search(testlist, 44))
print(binary_search(testlist, 20))
结果:
时间复杂度
最优时间复杂度就是刚好mid就是要查找的元素,最坏时间复杂度就二分法的一直分解的次数,n为序列的长度,也就是 n/2/2/2/2… =1,也就是122*2…=n, 也就是logn.所以时间复杂度是o(logn)