查找的基本概念
查找:在数据集合中寻找满足某种条件的数据元素的过程称为查找。
查找常见的几种方法:顺序查找、二分查找、二叉树查找、哈希查找。
顺序查找
顺序查找又称为线性查找,用于在线性表中查找。
如果数据项保存在列表这样的集合中,我们会称为这些数据项具有线性或顺序关系。
在python List中,这些数据项的存储位置称为下标,这些下标都是有序的整数
通过下标,我们就可以按照顺序来访问和查找数据项,这种称为“顺序查找”
要确定列表中是否存在需要查找的数据项,首先从列表的第一项开始,按照下标增加的顺序,逐个对比数据项,如果找到最后一个都没有发现要查找的项,就查找失败。
无序表查找
def search(alist, item):
pos = 0
found = False
while pos < len(alist) and not found:
if alist[pos] == item:
found = True
else:
pos = pos + 1
return found
tlist = [2,1,32,5,17,18,63,13,0]
print(search(tlist, 3)) #False
print(search(tlist, 13)) #True
有序表查找
def search(alist, item):
pos = 0
found = False
stop = False
while pos < len(alist) and not found and not stop:
if alist[pos] == item:
found = True
else:
if alist[pos] > item:
stop = True
else:
pos = pos + 1
return found
tlist = [2,1,32,5,17,18,63,13,0]
print(search(tlist, 3))
print(search(tlist, 13))
二分查找
二分查找又称为折半查找,优点是比较的次数少,查找的速度块,平均的性能更好;缺点是要求表是有序表,插入删除困难。折半查找适用于不经常变动而频繁查找的有序表。
假设表中元素是按照升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,就查找成功,否则利用中间位置记录将表分成前后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表,重复上面的过程,查找满足条件查找成功,或直到子表不存在为止,此时查找就不成功。
非递归实现
def binary_search(li, item):
first = 0
last = len(li) - 1
while first <= last:
midpoint = (first + last) // 2
if li[midpoint] == item:
return True
elif item < li[midpoint]:
last = midpoint - 1
else:
first = midpoint + 1
return False
testlist = [0, 1, 2, 8, 13, 17, 19, 32, 42, ]
print(binary_search(testlist, 3))
print(binary_search(testlist, 13))
递归实现
def binary_search(li, item):
if len(li) == 0:
return False
else:
midpoint = len(li) // 2
if midpoint > 0:
if li[midpoint] == item: # li[4] == 17 13 != 17
return True
else:
if item < li[midpoint]: # 17 < 13
return binary_search(li[:midpoint], item)
else:
return binary_search(li[midpoint+1:], item)
else:
return False
testlist = [0, 1, 2, 8, 13, 17, 19, 32, 42, ]
print(binary_search(testlist, 3))
print(binary_search(testlist, 13))