尝试一种时间复杂度至多 O(nlogn) 的数组排序

最新推荐文章于 2024-03-12 17:47:05 发布

YJYSimon

最新推荐文章于 2024-03-12 17:47:05 发布

阅读量3.4k

点赞数 12

分类专栏：数据结构与算法 C/C++ 文章标签：算法排序算法数据结构

本文链接：https://blog.csdn.net/weixin_44636463/article/details/113899840

版权

C/C++ 同时被 2 个专栏收录

4 篇文章 1 订阅

订阅专栏

数据结构与算法

2 篇文章 4 订阅

订阅专栏

尝试探寻一种高效的数组排序

一种混合排序方式

一种混合排序方式

一、主要思路

目前众多排序算法中，最快的算法时间复杂度为 $O (n l o g n)$ ，能否实现一种更高效的算法呢？本文尝试寻找一种时间复杂度至多为 $O (n l o g n)$ 的算法，该算法并不是自成一套的全新算法，而是将两种不同的算法取其优势混合而成，故称 “ 混合排序算法 ” .

1、时间复杂度 $max\{O(maxa - mina),\ O(n)\}$ 的排序法

首先来看一种特定情形下表现优良的算法 .对于给定数组 $a r r [n]$ ，

遍历数组 $a r r$ ，获得 $a r r$ 中最大值 $m a x a$ 与最小值 $m i n a$ ；
分配一个大小为 $m a x a - m i n a + 1$ 的数组 $s o r t$ ，元素初值均置为 $0$ ；
第二次遍历数组 $a r r$ ，将当前数组元素 $a r r [i]$ 对应的 $s o r t [a r r [i] - m i n a]$ 加 $1$ ，即 $s o r t [i]$ 的含义为元素 $i + m i n a$ 在 $a r r$ 中出现的次数；
遍历数组 $s o r t$ ，将所有非零元素 $s o r t [i]$ 对应的数 $m i n a + i$ 打印，同时 $s o r t [i]$ 减 $1$ .

当 $s o r t [i]$ 为零时，处理下一个元素 .

相应 C++ 代码为

#include <vector>
//没学过STL容器vector的同学可以理解为vector<int> a(n)就是int a[n] = {0};
vector<int> newSort(vector<int> &arr){
    //步骤1
    int mina = arr[0], maxa = arr[0];
    for(int i : arr) {
        mina = mina > i ? i : mina;
        maxa = maxa < i ? i : maxa;
    }
    //步骤2，3
    vector<int> sort(maxa - mina + 1);
    for(int i : arr) 
        sort[i - mina]++;
    //步骤4
    vector<int> res(arr.size());
    int index = 0;
    for(int i = 0; i < maxa - mina + 1; i++){
        if(sort[i]) {
            res[index++] = mina + i;
            sort[i--]--;
        }
    }
    return res;
}

//测试用例
int main(){
    vector<int> a = {6, 9, 4, 6, 8, 6, 7, 6, 5, 5, 9, 8,10};
    a = newSort(a);
    for(int i : a) cout << i << ' ';
    return 0;
}

通常情况下 $m a x a - m i n a + 1 > n$ ，但当 $a r r$ 中大多数元素相同时，有 $m a x a - m i n a + 1 < n$ ，所以该算法对应的时间复杂度为 $max\{O(maxa - mina),\ O(n)\}$ ，空间复杂度为 $O (m a x a - m i n a)$ . 这种算法适合于数据分布集中型的数组，数据越集中于某一区间， $m a x a - m i n a + 1$ 的值越小，时间复杂度也就越趋近 $O (n)$ .

目前其他算法 ( 除去希尔排序 ) ，最快的是堆排序、快速排序与归并排序，时间复杂度均为 $O (n l o g n)$ ，空间复杂度分别为 $O(1),\ O(logn),\ O(n)$ . 由于希尔排序的最优时间复杂度仍在证明中，本文暂不做考虑 .

当 $m a x a - m i n a < n l o g n$ 时，本算法时间复杂度优于归并/快速排序算法；但当 $m a x a - m i n a > n l o g n$ 时，归并/快速排序更优 . 若将两者结合，是否可以得到一个时间复杂度始终不超过 $O (n l o g n)$ 的算法呢？

2、混合排序方法

综上所述，可以尝试一种兼具两者性能的混合型排序算法：

对于给定数组 $a r r [n]$ ，

遍历数组 $a r r$ ，获得 $a r r$ 中最大值 $m a x a$ 与最小值 $m i n a$ ；
比较 $m a x a - m i n a$ 与 $n l o g n$ 大小，

当 $m a x a - m i n a < n l o g n$ 时，转到3 ；

当 $m a x a - m i n a > n l o g n$ 时，转到4 .
使用 $n e w S o r t ()$ 进行排序；
使用归并/快速/堆排序算法排序 .

混合排序算法 C++ 代码 ( 这里步骤4以快速排序为例)

#include <vector>
//稍加改动newSort()
vector<int> newSort(vector<int> &arr, int mina, int maxa){  
    vector<int> sort(maxa - mina + 1);
    for(int i : arr) 
        sort[i - mina]++;
    
    vector<int> res(arr.size());
    int index = 0;
    for(int i = 0; i < maxa - mina + 1; i++){
        if(sort[i]) {
            res[index++] = mina + i;
            sort[i--]--;
        }
    }
    return res;
}

//快速排序
//定义一个快排的划分函数part()，即一趟排序过程，将数组分为左右两部分，左边所有元素小于p，右边元素全部大于等于p
int part(vector<int> &arr, int low, int high){
    int p = arr[low];
    while(low < high) {
        while(low < high && arr[high] >= p) high--;
        arr[low] = arr[high];
        while(low < high && arr[low] <= p) low++;
        arr[high] = arr[low];
    }
    arr[low] = p;	//这行容易被忽略
    return low;
}

//采用递归快速排序
vector<int> quickSort(vector<int> &arr, int low, int high){
    if(low < high) {
        int pos = part(arr, low, high);		//part()划分
        quickSort(arr, low, pos - 1);
        quickSort(arr, pos + 1, high);
    }
    return arr;
}

//混合排序
vector<int> mixSort(vector<int> &arr){
    //步骤1
    int mina = arr[0], maxa = arr[0];
    int n = arr.size();
    for(int i : arr) {
        mina = mina > i ? i : mina;
        maxa = maxa < i ? i : maxa;
    }
    //步骤2,3,4,这里取log以2为底；
    if(maxa - mina + 1 < n * log(n) / log(2)) return newSort(arr, mina, maxa);	//newSort排序
    return quickSort(arr, 0, n - 1);	//快速排序
}

//测试用例
int main(){
    vector<int> a = {6, 9, 4, 2, 8, 6, 7, 3, 2, 5, 1};
    a = mixSort(a);
    for(int i : a) cout << i << ' ';
    return 0;
}