最近正好复习复习算法,于是从排序算法开始做一个总结。以下的代码均为原创,如果有任何问题,欢迎指正。简单来讲,排序算法的实质是将长度为n的数组中的数字按照从小到大或者从大到小的顺利排列。
简而言之,在不考虑算法的情况下,我们可以把排序抽象为如下的一个函数:array表示T类型的一个数组,num表示数组的长度。本文假设我们实现的排序算法都是按照从小到大的顺序排列;从大到小的排列类似。
template <class T>
void Order(T array[], int num)
1)选择算法:基本思想是每次从数组中选择最小的数,将这个数与已排序的数组最后一位交换。寻找第一个数时,我们需要遍历num个数才能判断出最小的数;寻找第i个数时,由于我们已经成功的将前i-1个数按序排列,我们只需要遍历num-i+1个数便能找到最小的数。
总而言之,时间复杂度为O(n2),而空间复杂度为O(1)。
- template <class T>
- void selectSort(T array[], int num)
- {
- T curItem;//哨兵元素,用于记录遍历时的较小值,将所以为排序数遍历后就是最小值
- int cur;//记录较小值或最小值的位置
- for(int i = 0; i < num; i++)//i代表当前有多少个元素已经成功排序
- {
- curItem = array[i];
- cur = i;
- //寻找未排序数的第一个数
- for(int j = i + 1; j < num; j++)
- {
- if(curItem >= array[j])
- {
- curItem = array[j];
- cur = j;
- }
- }
- //从未排序数种找出最小值
- if(cur != i)
- {
- T temp = array[cur];
- array[cur] = array[i];
- array[i] = temp;
- }
- //如果最小值不是未排序数种的第一个,则交换最小值与未排序数的第一个。
- }
- }
2)简单插入算法:基本思想如同整理扑克牌,一开始手中有1张牌,每抽一张牌便将新抽的牌插入到手中有序的牌列种。
总而言之,时间复杂度为O(n2),而空间复杂度为O(1)。
- template <class T>
- void simpleInsertSort(T array[], int num)
- {
- for(int i = 1; i < num; i++)//初始时有一张牌,每抽取一张是一次循环
- {
- int cur = i;//当前新抽取的牌
- for(int j = i - 1; j >= 0; j--)
- {
- if(array[j] > array[cur])
- {
- T temp = array[j];
- array[j] = array[cur];
- array[cur] = temp;
- cur = j;
- }
- else
- {
- break;
- }
- }
- //手中的牌是有序的,于是每抽一张就一次往前比较。新牌比前面的牌小便往前移动直到手牌整理完成
- }
- }
3)折半插入算法:基本思想和简单插入算法相同,但是新牌与手牌比较的时候不必一一比较(因为手牌已经有序排列了),我们可以用二分查找的方法来将新牌左移
总而言之,时间复杂度有所提高,为O(nlogn),而空间复杂度为O(1)。
- template <class T>
- void binaryInsertSort(T array[], int num)
- {
- for(int i = 1; i < num; i++)//初始时有一张牌,每抽取一张是一次循环
- {
- int low = 0;
- int high = i - 1;
- //用两个位置坐标来表示手牌
- while(low <= high)
- {
- int middle = low + (high - low) / 2;
- if(array[middle] <= array[i])
- {
- low = middle + 1;
- }
- else
- {
- high = middle - 1;
- }
- };
- //利用二分法找到插入的位置
- if(low != i)
- {
- T temp = array[i];
- for(int j = i; j > low; j--)
- {
- array[j] = array[j-1];
- }
- array[low] = temp;
- }
- //如果插入的位置与新牌的位置不同,则将新牌插入
- }
- }
4)希尔排序:基本思想和简单插入算法类似。简单插入算法每一次从距离为一的位置处抽取新值。如果数据分布比较分散,简单插入算法效率较低。于是,我们可以采用距离(称之为步长)大于一的方式来抽取新值。例如,当步长为n时,数组中相当于有n个平行的子数组在做简单插入算法。运算之后,数组变得更加为有序,于是我们可以不断地缩小步长直到步长为1(简单插入算法),最终完成排序。当数组越有序时,简单插入算法的效率越高。
总而言之,时间复杂度不容易计算,但实验统计结果大约为n1.25到1.6n1.25,而空间复杂度为O(1)。希尔是一种不稳定的算法。
- template <class T>
- void shellSort(T array[], int num)
- {
- int multipe = 3;//循环次数
- int step = 1;
- for(; step < num; step = step * multipe + 1);
- step = (step - 1) / 3;
- //计算出该数组支持的最长步长
- while(step >= 1)
- {
- for(int i = 0; i < step; i++)//给定步长时平行计算的子数组数目
- {
- for(int j = i + step; j < num; j += step)
- {
- int cur = j;
- for(int k = j - step; k >= i; k--)
- {
- if(array[k] > array[cur])
- {
- T temp = array[cur];
- array[cur] = array[k];
- array[k] = temp;
- cur = k;
- }
- }
- }
- //步长为step的简单插入算法
- }
- step = (step - 1) / 3;//缩短步长
- }
- }
5)归并排序:初始时,我们假设我们得到了num个长度为1的子数组;每一次运算时将两个有序的子数组合并成一个父数组。
总而言之,时间复杂度为O(n2),而空间复杂度为O(n)。
- template <class T>
- T minValue(T a, T b)
- {
- return a<b?a:b;
- }
- //两个值中取较小值
- template <class T>
- void merge(T from[], T to[], int low, int high, int length)//从数组from中合并从low到high之间的子数组并保存到数组to中:第一个数组长度为length,第二个数组长度可能为length或小于length
- {
- int first = low;//第一个子数组的开始位置
- int second = low + length;//第二个子数组的开始位置
- int cur = low;//目标存储数组中的开始位置
- while(first < low + length && second <= high)
- {
- to[cur++] = minValue<T>(from[first],from[second]);
- from[first]<from[second]?first++:second++;
- };//依次选择两个子数组中较小值添加到目标存储数组中
- while(first < low + length)
- {
- to[cur++] = from[first++];
- };//若第一个子数组还有未添加的值,添加到目标存储数组的尾部
- while(second <= high)
- {
- to[cur++] = from[second++];
- };//若第二个子数组还有未添加的值,添加到目标存储数组的尾部
- }
- //归并排序
- template <class T>
- void mergeSort(T array[], int num)
- {
- if(num <= 0)
- return;
- int len = 1;//子数组长度
- int cur = 0;//初始化指针
- T* tempArray = new T[num];//临时存储数组
- while(len<num)//子数组长度小于num时循环,大于num时排序结束
- {
- while(cur<num)
- {
- int m = minValue<int>(cur + len * 2, num);
- //两个子数组的总长度,考虑越界
- for(int i = cur; i < m; i++)
- {
- tempArray[i] = array[i];
- }
- //将数值临时存储在临时存储数组中
- merge(tempArray, array, cur, m - 1, len);
- //合并相邻子数组
- cur += len * 2;
- //指针指向下一组子数组
- };
- //依次选择相邻的子数组合并
- len *= 2;
- cur = 0;
- //长度翻倍且重置指针
- };
- delete tempArray;
- }
6)冒泡排序:通过依次交换两个相邻的两个数,遍历num个数后便将最大的数推送到了最后。推送第一个数时,我们需要遍历num个数才能推出最大值;推送第i个数时,由于我们已经成功的将i-1个数按序推出,我们只需要遍历num-i+1个数便能推出当前最大的数。
总而言之,时间复杂度为O(n2),而空间复杂度为O(1)。
- template <class T>
- void bubbleSort(T array[], int num)
- {
- for(int i = 0; i < num; i++)
- {
- for(int j = 0; j < num - i; j++)
- {
- if(array[j-1] > array[j])
- {
- T temp = array[j-1];
- array[j-1] = array[j];
- array[j] = temp;
- }
- }
- //依次交换相邻的数将最大值推送到数组尾部已排序的数组最前端
- }
- }
7)快速排序:对冒泡排序法的优化,基本思想也是将两个数交换,但是我们希望尽量将较小的数交换到数组左边,将交大的数交换到数组右边。计算时我们从数组中随机选择一个数作为参考数,定义一个指针从左向右遍历,另一个指针从右向左遍历。第一个指针寻找大于参考数的数,第二个指针寻找小于参考数的数,并将两个数交换。当两个指针相遇时一次循环结束,循环结束时相遇位置的左侧的数均小于参考数,右侧的数均大于参考数。我们可以递归地对左侧和右侧的数组运用快速排序算法。
总而言之,时间复杂度为O(nlogn),而空间复杂度为O(1)。
- template <class T>
- void quick(T array[], int low, int high)
- {
- if(high - low > 10)
- {
- simpleInsertSort(array + low, high - low + 1);
- return;
- }
- //长度小于10时采用简单插入算法
- T key = array[low];//利用第一个数作为参考数
- int i = low;
- int j = high;
- while(true)
- {
- for(;array[i] <= key && i < j;i++);//从左向右选择大于参考数的数
- for(;array[j] > key && j > i;j--);//从右向左选择小于等于参考数的数
- if(i == j)
- {
- break;
- }
- //两个指针相遇时这次循环结束
- T temp = array[i];
- array[i] = array[j];
- array[j] = temp;
- //交换两个指针的数
- };
- if(i == j)
- {
- if(array[i] > key)
- {
- quick<T>(array, low, i-1);
- quick<T>(array, i, high);
- }
- else
- {
- quick<T>(array, low, i);
- quick<T>(array, i + 1, high);
- }
- }
- //针对左侧右侧循环采用快速循环
- }
- //快速排序
- template <class T>
- void quickSort(T array[], int num)
- {
- int low = 0;
- int high = num - 1;
- quick<T>(array, low, high);
- }
8)堆排序:堆就是一颗树,分为最小化堆与最大化堆,最小化堆的特点是父节点大于等于子节点。堆的存储可以利用数字完成,位置为0的节点表示更节点。对于父节点n,左右子节点为n*2+1与n*2+2。
对于一个父节点两个子节点的子堆,我们可以分成方便的转化使父节点大于等于子节点。整个堆的整理便是循环递归计算。
总而言之,建堆时间复杂度为O(n),删除、插入等操作时间复杂度为)(logn)。而空间复杂度为O(n)。
- template <class T>
- class Heap
- {
- public:
- Heap(T array[], int num);
- ~Heap();
- T pop();//取出根节点
- void insert(T value);//插入新节点
- private:
- void buildHeap();//建堆
- void switchHeap(int n);//计算一个父节点两个子节点的子堆
- T* data;//数据空间
- int len;//已有数据长度
- int maxLen;//最大可以容纳数据长度
- };
- template <class T>
- Heap<T>::Heap(T array[], int num)
- {
- maxLen = num * 2;
- data = new T[maxLen];
- len = num;
- //定义数据,记录已有长度,并预留相同的空间用于堆增长
- for(int i = 0; i < num; i++)
- {
- data[i] = array[i];
- }
- //初始化已有数据
- for(int i = num; i < num * 2; i++)
- {
- data[i] = array[i];
- }
- //初始化预留数据
- buildHeap();
- //建堆
- }
- template <class T>
- Heap<T>::~Heap()
- {
- delete data;
- data = null;
- len = 0;
- }
- template <class T>
- void Heap<T>::buildHeap()
- {
- int level = floor(log(len)/log(2)) + 1;
- //根据长度计算树的高度,高度为l的树共2的l次方-1个数据
- for(int i = pow(2, level) - 2; i >= 0; i--)
- {
- switchHeap(i);
- }
- //从树倒数第二层,叶节点的父节点向根节点循环,置换每个三节点子堆
- }
- template <class T>
- void Heap<T>::switchHeap(int n)
- {
- if(n * 2 + 2 < len)//包含左右节点时
- {
- int m = data[n * 2 + 1]<data[n * 2 + 2]?n * 2 + 1:n * 2 + 2;
- //找到左右节点中较小值
- if(data[n]>data[m])
- {
- T temp = data[n];
- data[n] = data[m];
- data[m] = temp;
- }
- //如果较小值比父节点小,交换
- switchHeap(n * 2 + 1);
- switchHeap(n * 2 + 2);
- //置换子节点中的子堆
- }
- else if(n * 2 + 1 < len)//只包含左节点
- {
- if(data[n]>data[n * 2 + 1])
- {
- T temp = data[n];
- data[n] = data[n * 2 + 1];
- data[n * 2 + 1] = temp;
- }
- //如果子节点比父节点小,交换
- switchHeap(n * 2 + 1);
- //置换子节点中的子堆
- }
- //没有子节点不计算
- }
- template <class T>
- T Heap<T>::pop()
- {
- T temp = data[0];
- //取出根节点
- data[0] = data[len - 1];
- len--;
- //将最后一个数放到根节点
- switchHeap(0);
- //整理根节点
- return temp;
- }
- template <class T>
- void Heap<T>::insert(T value)
- {
- if(len == maxLen)//如果长度超过最长可用长度,扩展空间
- {
- maxLen = maxLen * 2;
- T* tmp = new T[maxLen];
- //分配新空间
- for(int i = 0;i<len;i++)
- {
- tmp[i] = data[i];
- }
- //复制数据
- for(int i = len;i<maxLen;i++)
- {
- tmp[i] = data[i];
- }
- //初始化预留数据
- delete data;
- data = tmp;
- tmp = NULL;
- }
- data[len++] = value;
- //将插入值放入数组末尾
- for(int i = len - 1;i>=0;i--)
- {
- if(data[(i - 2) / 2]>data[i])
- {
- T temp = data[(i - 2) / 2];
- data[(i - 2) / 2] = data[i];
- data[i] = temp;
- }
- else
- {
- break;
- }
- }
- //沿着树枝将最小值向根节点推送
- }