5.1 搜索
搜索(Searching)是基于特定标准从数据的集合中选出特定信息的过程。
序列搜索(sequence search)是通过使用特定的搜索关键字(search key)从序列中找出特定项。
关键字(key)是一个独一无二的值,它用于在序列中找出特定项。它可以是简单的数据类型,也可以是复杂的数据类型(复合关键字)。
5.1.1 线性搜索
线性搜索(linear search)是对序列进行遍历,直到找到特定的项或是将所有元素遍历完为止。
python中的in操作符就是其中的一个例子。
寻找特定项
#-*-coding: utf-8-*-
# 线性查找的实现,时间复杂度O(n)
# 在未排序序列上搜索
def linearSearch(theValues, target):
n = len(theValues)
for i in range(n):
if theValues[i] == target:
return True
return False
显然,上述代码的时间复杂度是O(n)。
在一个已排序序列中搜索
在已排序序列中搜索,在元素存在于序列中的情况下,一般要好于在未排序情况。
# 在已排序序列上搜索,假设序列从小到大排列
def sortedLinearSearch(theValues, target):
n = len(theValues)
for i in range(n):
if theValues[i] == target:
return True
elif theValues[i] > target:
return False
return False
但是当元素不存在时,仍然要遍历完整个序列,所以时间复杂度仍然是O(n)。
二分法查找
二分法查找(binary search)也是在已排序序列上进行,它体现的是分治法的策略。
对于要查找的元素,可以比较它与序列中点的值的大小,若等于序列中点值,则结果显然。若大于序列中点值,则其不可能位于序列的前半部分,只可能位于序列的后半部分,反之亦然。之后不断重复这一过程,直到只剩一个元素为止。
#-*-coding: utf-8-*-
# 二分法查找的实现,时间复杂度是O(log n)
def binarySearch(theValues, target):
low = 0
high = len(theValues) - 1
while low <= high:
mid = (high + low) / 2
if theValues[mid] = target:
return True
elif target < theValues[mid]:
high = mid - 1
else:
low = mid + 1
return False
显然,其时间复杂度是O(log n),要优于线性搜索。