桶排序
- 工作的原理是将数据分到有限数量的桶子里,然后每个桶再分别排序(有可能再使用别的排序算法或是以递回方式继续使用桶排序进行排序)
- 桶排序是将待排序集合中处于同一个值域的元素存入同一个桶中,也就是根据元素值特性将集合拆分为多个区域,则拆分后形成的多个桶,从值域上看是处于有序状态的。对每个桶中元素进行排序,则所有桶中元素构成的集合是已排序的。
介绍
桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。为了使桶排序更加高效,我们需要做到这两点:
- 在额外空间充足的情况下,尽量增大桶的数量
- 使用的映射函数能够将输入的 N 个数据均匀的分配到 K 个桶中
同时,对于桶中元素的排序,选择何种比较排序算法对于性能的影响至关重要。
-
什么时候最快
当输入的数据可以均匀的分配到每一个桶中。 -
什么时候最慢
当输入的数据被分配到了同一个桶中。
算法步骤
- 设置固定数量的空桶。
- 把数据放到对应的桶中。
- 对每个不为空的桶中数据进行排序。
- 拼接不为空的桶中数据,得到结果。
代码实现
import random
def bucket_sort1(arr, n):
# 按照 i = value // (maxi // n)的分法将范围在0-100的数组分在10个桶(0-9号桶)中的话,那么10就会分在第2个桶(即标号为1的桶)里面,100就分在了第n+1=11个桶里了
buckets = [[] for _ in range(n + 1)] # 创建 n+1个空桶(当数组范围是0-100时,假设把这些数分在10个桶里面,那么100这个数就被分在了11号桶里面了,所以这里给它加了一个桶),也可以按照bucket_sort2里面的写法
maxi = arr[0]
for num in arr:
if num > maxi:
maxi = num
# 把元素放入桶中
for value in arr:
i = value // (maxi // n) # i表示元素值(value)放到几号桶中
buckets[i].append(value)
# 把元素放入桶中的时候顺便排序
for j in range(len(buckets[i]) - 1, 0, -1):
if buckets[i][j] < buckets[i][j - 1]:
buckets[i][j], buckets[i][j - 1] = buckets[i][j - 1], buckets[i][j]
else:
break
new_arr = []
for buc in buckets:
new_arr.extend(buc)
return new_arr
def bucket_sort2(arr, n):
maxi = arr[0]
for num in arr:
if num > maxi:
maxi = num
buckets = [[] for _ in range(n )]
for value in arr:
i = min(value // (maxi // n), n-1)
buckets[i].append(value)
# 用冒泡排序法对每个桶进行排序
for buc in buckets:
for i in range(len(buc) - 1):
for j in range(1, len(buc) - i):
if buc[j - 1] > buc[j]:
buc[j - 1], buc[j] = buc[j], buc[j - 1]
arr.clear()
for buc in buckets:
arr.extend(buc)
return arr
if __name__ == '__main__':
numbers1 = [random.randint(0, 100) for _ in range(20)]
print(numbers1)
print(bucket_sort1(numbers1, 10))
numbers2 = [9, 6, 8, 5, 2, 1, 4, 58, 96, 12, 56, 9, 7, 4, 1, 0, 3, 6, 9]
print(bucket_sort2(numbers2, 10))