桶排序算法详解：从原理到实现

农芬焰

于 2025-06-06 09:05:21 发布

阅读量260

点赞数 5

本文链接：https://blog.csdn.net/gitblog_00823/article/details/148465131

版权

桶排序算法详解：从原理到实现

LeetCode-Py ⛽️「算法通关手册」：超详细的「算法与数据结构」基础讲解教程，从零基础开始学习算法知识，800+ 道「LeetCode 题目」详细解析，200 道「大厂面试热门题目」。项目地址: https://gitcode.com/gh_mirrors/le/LeetCode-Py

桶排序算法概述

桶排序（Bucket Sort）是一种高效的分布式排序算法，特别适用于处理均匀分布的数据集。它的核心思想是将待排序元素分散到若干个"桶"中，然后对每个桶中的元素进行单独排序，最后合并所有桶的结果得到有序序列。

算法核心思想

桶排序的基本思想可以概括为以下三步：

分桶：根据元素值将数据分配到不同的桶中
桶内排序：对每个非空桶中的元素进行排序
合并结果：按顺序将各个桶中的元素合并

这种"分而治之"的策略使得桶排序在处理大规模数据时表现出色，特别是当数据分布均匀时，效率尤为突出。

算法详细步骤

让我们通过一个具体例子 [39, 49, 8, 13, 22, 15, 10, 30, 5, 44] 来理解桶排序的完整过程：

确定桶的数量和范围：
- 找出数组中的最小值(5)和最大值(49)
- 设定桶的大小为10（常见做法是设为数组长度的平方根）
- 计算需要的桶数：(49-5)/10 + 1 = 5个桶
- 桶的范围分别为：[5,15), [15,25), [25,35), [35,45), [45,55)
元素分配到桶中：
- 5 → 桶0
- 8,10,13 → 桶0
- 15,22 → 桶1
- 30 → 桶2
- 39,44 → 桶3
- 49 → 桶4
桶内排序：
- 对每个桶内的元素进行排序（这里使用插入排序）
- 桶0排序后：[5,8,10,13]
- 桶1排序后：[15,22]
- 桶2排序后：[30]
- 桶3排序后：[39,44]
- 桶4排序后：[49]
合并结果：
- 按桶顺序合并：[5,8,10,13,15,22,30,39,44,49]

代码实现解析

以下是桶排序的Python实现，包含插入排序作为桶内排序算法：

class Solution:
    def insertionSort(self, nums: [int]) -> [int]:
        # 插入排序实现
        for i in range(1, len(nums)):  # 从第二个元素开始遍历
            temp = nums[i]  # 当前待插入元素
            j = i
            # 在已排序部分从后向前扫描
            while j > 0 and nums[j - 1] > temp:
                nums[j] = nums[j - 1]  # 元素后移
                j -= 1
            nums[j] = temp  # 插入到正确位置
        return nums

    def bucketSort(self, nums: [int], bucket_size=5) -> [int]:
        # 计算数组的最小值和最大值
        nums_min, nums_max = min(nums), max(nums)
        # 计算需要的桶数量
        bucket_count = (nums_max - nums_min) // bucket_size + 1
        # 初始化桶数组
        buckets = [[] for _ in range(bucket_count)]

        # 将元素分配到各个桶中
        for num in nums:
            buckets[(num - nums_min) // bucket_size].append(num)

        # 对每个桶排序并合并结果
        res = []
        for bucket in buckets:
            self.insertionSort(bucket)  # 使用插入排序对桶内元素排序
            res.extend(bucket)  # 将排序后的桶合并到结果中
        
        return res

    def sortArray(self, nums: [int]) -> [int]:
        return self.bucketSort(nums)

代码中的关键点：

insertionSort方法实现了插入排序，用于对每个桶内的少量元素进行排序
bucketSort方法实现了桶排序的主要逻辑：
- 计算合适的桶数量
- 将元素分配到对应的桶中
- 对每个桶排序并合并结果
默认桶大小为5，这是一个经验值，可以根据数据特点调整

算法性能分析

时间复杂度

桶排序的时间复杂度取决于以下几个因素：

分配阶段：将n个元素分配到m个桶中，时间复杂度为O(n)
排序阶段：假设使用O(klogk)的排序算法对每个桶排序，k是桶的平均大小
- 最理想情况：当m≈n时，每个桶只有1个元素，总时间复杂度为O(n)
- 平均情况：O(n + n(logn - logm))，当m与n成比例时，接近O(n)
- 最坏情况：所有元素都分配到一个桶中，退化为O(nlogn)