1. 基数排序原理和步骤
基数排序是一种非比较型的排序算法,特别适用于处理整数或者字符串等可以分解为多个部分的数据。其基本思想是按位(或字符)进行排序,从最低有效位到最高有效位逐次排序。基数排序常分为LSD(Least Significant Digit)和MSD(Most Significant Digit)两种类型。以下是基数排序的详细步骤,以LSD为例:
1.1 确定最大值的位数
首先,确定待排序数组中最大元素的位数(或字符串的长度)。这个步骤决定了排序需要进行的轮次数。
1.2 从最低有效位开始排序
从最低有效位开始,对数组进行排序。排序可以使用稳定的计数排序或桶排序,以确保排序过程是稳定的,即相同位数的元素保持相对顺序不变。
1.3 逐位排序
依次对每一位进行排序,直到最高有效位。每次排序都根据当前位的值,将元素放到相应的位置上。
1.4 重复以上步骤,直到所有位数排序完成
对所有位数依次排序后,整个数组即为有序。
基数排序的完整步骤
- 确定最大值的位数: 确定数组中最大元素的位数。
- 逐位排序: 从最低有效位开始,依次对每一位进行排序。
- 完成排序: 当所有位数排序完成,数组有序。
2. 基数排序的伪代码
void radixSort(vector<int>& arr) {
// 找到数组中的最大数,确定最大位数
int maxVal = *max_element(arr.begin(), arr.end());
int maxDigits = log10(maxVal) + 1;
// 逐位进行计数排序,从最低有效位开始
for (int exp = 1; maxVal / exp > 0; exp *= 10) {
countingSort(arr, exp);
}
}
void countingSort(vector<int>& arr, int exp) {
int n = arr.size();
vector<int> output(n); // 输出数组
vector<int> count(10, 0); // 计数数组
// 计算每个数字出现的次数
for (int i = 0; i < n; i++) {
int index = (arr[i] / exp) % 10;
count[index]++;
}
// 修改计数数组,使其存储实际位置
for (int i = 1; i < 10; i++) {
count[i] += count[i - 1];
}
// 构建输出数组
for (int i = n - 1; i >= 0; i--) {
int index = (arr[i] / exp) % 10;
output[count[index] - 1] = arr[i];
count[index]--;
}
// 将输出数组复制到 arr,使其按当前位排序
for (int i = 0; i < n; i++) {
arr[i] = output[i];
}
}
3. 基数排序的Python实现
Python代码实现
def counting_sort(arr, exp):
n = len(arr)
output = [0] * n
count = [0] * 10
# 计算每个数字出现的次数
for i in range(n):
index = arr[i] // exp
count[index % 10] += 1
# 修改计数数组,使其存储实际位置
for i in range(1, 10):
count[i] += count[i - 1]
# 构建输出数组
for i in range(n - 1, -1, -1):
index = arr[i] // exp
output[count[index % 10] - 1] = arr[i]
count[index % 10] -= 1
# 将输出数组复制到 arr,使其按当前位排序
for i in range(n):
arr[i] = output[i]
def radix_sort(arr):
# 找到数组中的最大数,确定最大位数
max_val = max(arr)
exp = 1
# 逐位进行计数排序,从最低有效位开始
while max_val // exp > 0:
counting_sort(arr, exp)
exp *= 10
示例
arr = [170, 45, 75, 90, 802, 24, 2, 66]
print(“原始数组:”, arr)
radix_sort(arr)
print(“排序后数组:”, arr)
4. 算法时间复杂度分析
(1)计数排序的时间复杂度: 计数排序的时间复杂度为 O(n + k),其中 n 是数组中元素的个数,k 是计数数组的大小。在基数排序中,k 是常数(对于十进制数来说,k = 10),因此计数排序的时间复杂度为 O(n)。
(2)基数排序的时间复杂度: 基数排序需要进行 d 次计数排序,其中 d 是最大数的位数。在每次计数排序中,时间复杂度为 O(n),因此总的时间复杂度为 O(d * n)。
(3)总体时间复杂度: 基数排序的总体时间复杂度为 O(d * n),其中 d 是最大数的位数,n 是数组中元素的个数。