概述
排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。这里我们详细介绍一下内部排序的几种常用排序算法。
当n较大,则应采用时间复杂度为O(nlog2n)的排序方法:快速排序、堆排序或归并排序序。
快速排序:是目前基于比较的内部排序中被认为是最好的方法,当待排序的关键字是随机分布时,快速排序的平均时间最短;
1、插入排序
1.1、直接插入排序
基本思想:
将一个记录插入到已排序好的有序表中,从而得到一个新,记录数增1的有序表。即:先将序列的第1个记录看成是一个有序的子序列,然后从第2个记录逐个进行插入,直至整个序列有序为止。
要点:设立哨兵,作为临时存储和判断数组边界之用。
直接插入排序示例:
如果碰见一个和插入元素相等的,那么插入元素把想插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序就是排好序后的顺序,所以插入排序是稳定的。
代码实现:package com.dong.sortalgorithm;
/**
* author zhendong.Z
* version 2017-04-10 11:41
*/
/**
* 简单插入排序
*/
public class InsertSort {
public static void insertSort(int[] arr) {
if (arr == null || arr.length == 0)
return;
for (int i = 1; i < arr.length; i++) {
int j = i;
int target = arr[i];//待插入的
//后移
while (j > 0 && target < arr[j - 1]) {
arr[j] = arr[j - 1];
j--;
}
//插入
arr[j] = target;
}
}
}
效率:
时间复杂度:O(n^2).
其他的插入排序有二分插入排序,2-路插入排序。
1.2、希尔排序
基本思想:
先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,待整个序列中的记录“基本有序”时,再对全体记录进行依次直接插入排序。
操作方法:
- 选择一个增量序列t1,t2,…,tk,其中ti>tj,tk=1;
- 按增量序列个数k,对序列进行k 趟排序;
- 每趟排序,根据对应的增量ti,将待排序列分割成若干长度为m 的子序列,分别对各子表进行直接插入排序。仅增量因子为1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。
希尔排序的示例:
算法实现:
我们简单处理增量序列:增量序列d = {n/2 ,n/4, n/8 .....1} n为要排序数的个数
即:先将要排序的一组记录按某个增量d(n/2,n为要排序数的个数)分成若干组子序列,每组中记录的下标相差d.对每组中全部元素进行直接插入排序,然后再用一个较小的增量(d/2)对它进行分组,在每组中再进行直接插入排序。继续不断缩小增量直至为1,最后使用直接插入排序完成排序。
package com.dong.sortalgorithm;
/**
* author zhendong.Z
* version 2017-04-10 11:44
*/
/**
* 希尔排序
*/
public class ShellSort {
public static void shellInsert(int[] arr, int increment) {
for (int i = increment; i < arr.length; i++) {
int j = i - increment;
int temp = arr[i];//记录要插入的数据
while (j >= 0 && arr[j] > temp) {//从后向前,找到比其小的数的位置
arr[j + increment] = arr[j];//向后挪动
j -= increment;
}
if (j != i - increment) {//存在比其小的数
arr[j + increment] = temp;
}
}
}
public static void shellSort(int[] arr) {
if (arr == null || arr.length == 0)
return;
int increment = arr.length / 2;
while (increment >= 1) {
shellInsert(arr, increment);
increment /= 2;
}
}
}
希尔排序时效分析很难,关键码的比较次数与记录移动次数依赖于增量因子序列d的选取,特定情况下可以准确估算出关键码的比较次数和记录的移动次数。目前还没有人给出选取最好的 增量因子序列 的方法。 增量因子序列 可以有各种取法,有取奇数的,也有取质数的,但需要注意: 增量因子 中除1 外没有公因子,且最后一个 增量因子 必须为1。希尔排序方法是一个不稳定的排序方法。
2、选择排序
2.1、简单选择排序
基本思想:
在要排序的一组数中,选出最小(或者最大)的一个数与第1个位置的数交换;然后在剩下的数当中再找最小(或者最大)的与第2个位置的数交换,依次类推,直到第n-1个元素(倒数第二个数)和第n个元素(最后一个数)比较为止。
简单选择排序的示例:
操作方法:
第一趟,从n 个记录中找出关键码最小的记录与第一个记录交换;
第二趟,从第二个记录开始的n-1 个记录中再选出关键码最小的记录与第二个记录交换;
以此类推.....
第i 趟,则从第i 个记录开始的n-i+1 个记录中选出关键码最小的记录与第i 个记录交换,
直到整个序列按关键码有序。
算法实现:
package com.dong.sortalgorithm;
/**
* author zhendong.Z
* version 2017-04-10 11:29
*/
/**
* 选择排序
* 思路:在一次排序后把最小的元素放在最前面,对整体进行选择,例:4,3,8,6,9首先要选择4以外的最小数来和4交换,也就是3,4进行选择和交换
*/
public class SelectSort {
public static void selectSort(int[] arr) {
if (arr == null || arr.length == 0) {
return;
}
int minIndex = 0;
for (int i = 0; i < arr.length - 1; i++) {//只需要比较n-1次
minIndex = 1;
for (int j = i + 1; j < arr.length; j++) {//从i+1开始比较,因为minIndex默认为i了,i就没必要比了
if (arr[j] < arr[minIndex]) {
minIndex = j;
}
}
if (minIndex != i) {//如果minIndex不为1,说明找到了更小的值,交换之
swap(arr, i, minIndex);
}
}
}
public static void swap(int[] arr, int i, int j) {
int temp = arr[i];
arr[i] = arr[j];
arr[j] = temp;
}
}
2.2、堆排序
基本思想:
堆的定义如下:具有n个元素的序列(k1,k2,...,kn),当且仅当满足
时称之为堆。由堆的定义可以看出,堆顶元素(即第一个元素)必为最小项(小顶堆)。
若以一维数组存储一个堆,则堆对应一棵完全二叉树,且所有非叶结点的值均不大于(或不小于)其子女的值,根结点(堆顶元素)的值是最小(或最大)的。如:
(a)大顶堆序列:(96, 83,27,38,11,09)
(b) 小顶堆序列:(12,36,24,85,47,30,53,91)
初始时把要排序的n个数的序列看作是一棵顺序存储的二叉树(一维数组存储二叉树),调整它们的存储序,使之成为一个堆,将堆顶元素输出,得到n 个元素中最小(或最大)的元素,这时堆的根节点的数最小(或者最大)。然后对前面(n-1)个元素重新调整使之成为堆,输出堆顶元素,得到n 个元素中次小(或次大)的元素。依此类推,直到只有两个节点的堆,并对它们作交换,最后得到有n个节点的有序序列。称这个过程为堆排序。
因此,实现堆排序需解决两个问题:
1. 如何将n 个待排序的数建成堆;
2. 输出堆顶元素后,怎样调整剩余n-1 个元素,使其成为一个新堆。
首先讨论第二个问题:输出堆顶元素后,对剩余n-1元素重新建成堆的调整过程。
调整小顶堆的方法:
1)设有m 个元素的堆,输出堆顶元素后,剩下m-1 个元素。将堆底元素送入堆顶((最后一个元素与堆顶进行交换),堆被破坏,其原因仅是根结点不满足堆的性质。
2)将根结点与左、右子树中较小元素的进行交换。
3)若与左子树交换:如果左子树堆被破坏,即左子树的根结点不满足堆的性质,则重复方法 (2).
4)若与右子树交换,如果右子树堆被破坏,即右子树的根结点不满足堆的性质。则重复方法 (2).
5)继续对不满足堆性质的子树进行上述交换操作,直到叶子结点,堆被建成。
称这个自根结点到叶子结点的调整过程为筛选。如图:
再讨论对n 个元素初始建堆的过程。
建堆方法:对初始序列建堆的过程,就是一个反复进行筛选的过程。
1)n 个结点的完全二叉树,则最后一个结点是第个结点的子树。
2)筛选从第个结点为根的子树开始,该子树成为堆。
3)之后向前依次对各结点为根的子树进行筛选,使之成为堆,直到根结点。
如图建堆初始过程:无序序列:(49,38,65,97,76,13,27,49)
算法的实现:
从算法描述来看,堆排序需要两个过程,一是建立堆,二是堆顶与堆的最后一个元素交换位置。所以堆排序有两个函数组成。一是建堆的渗透函数,二是反复调用渗透函数实现排序的函数。
package com.dong.sortalgorithm;
/**
* author zhendong.Z
* version 2017-04-10 11:43
*/
/**
* 堆排序
*/
public class HeapSort {
/**
* 堆筛选,除了start外,start-end均满足大顶堆的定义
* 调整之后start-end称为一个大顶堆
*/
public static void heapAdjust(int[] arr, int start, int end) {
int temp = arr[start];
//左右孩子的节点分别为2*i+1, 2*i+2
for (int i = 2 * start + 1; i <= end; i *= 2) {
//选择出左右孩子较下的角标
if (i < end && arr[i] < arr[i + 1]) {
i++;
}
if (temp >= arr[i]) {
break;//已经为大顶堆,=保持稳定性
}
arr[start] = arr[i];//将子节点上移
start = i;//下一筛选
}
arr[start] = temp;//插入正确位置
}
public static void heapSort(int[] arr) {
if (arr == null || arr.length == 0)
return;
//建立大顶堆
for (int i = arr.length / 2; i >= 0; i--) {
heapAdjust(arr, i, arr.length - 1);
}
for (int i = arr.length - 1; i >= 0; i--) {
swap(arr, 0, i);
heapAdjust(arr, 0, i - 1);
}
}
public static void swap(int[] arr, int i, int j) {
int temp = arr[i];
arr[i] = arr[j];
arr[j] = temp;
}
}
分析:
设树深度为k,。从根到叶的筛选,元素比较次数至多2(k-1)次,交换记录至多k 次。所以,在建好堆后,排序过程中的筛选次数不超过下式:
而建堆时的比较次数不超过4n 次,因此堆排序最坏情况下,时间复杂度也为:O(nlogn )。
3、交换排序
3.1冒泡排序
基本思想:
在要排序的一组数中,对当前还未排好序的范围内的全部数,自上而下对相邻的两个数依次进行比较和调整,让较大的数往下沉,较小的往上冒。即:每当两相邻的数比较后发现它们的排序与排序要求相反时,就将它们互换。
package com.dong.sortalgorithm;
/**
* author zhendong.Z
* version 2017-04-10 11:20
*/
/**
* 冒泡排序(稳定的)
*/
public class BubbleSort {
public static void bubbleSort(int[] arr) {
if (arr == null || arr.length == 0) {
return;
}
for (int i = 0; i < arr.length - 1; i++) {
for (int j = 0; j < arr.length; j++) {
if (arr[j] < arr[j - 1]) {
int temp = arr[j - 1];
arr[j - 1] = arr[j];
arr[j] = temp;
}
}
}
}
}
3.2快速排序
基本思想:
1)选择一个基准元素,通常选择第一个元素或者最后一个元素,
2)通过一趟排序讲待排序的记录分割成独立的两部分,其中一部分记录的元素值均比基准元素值小。另一部分记录的 元素值比基准值大。
3)此时基准元素在其排好序后的正确位置
4)然后分别对这两部分记录用同样的方法继续进行排序,直到整个序列有序。
快速排序的示例:
(a)一趟排序的过程:
(b)排序的全过程
算法的实现:
public class QuickSort {
//划分
public static int partition(int[] arr, int left, int right) {
int pivoKey = arr[left];
while (left < right) {
while (left < right && arr[right] >= pivoKey) {
right--;
arr[left] = arr[right];//把小的移到左边
}
while (left < right && arr[left] <= pivoKey) {
left++;
arr[right] = arr[left];//把大的移到右边
}
}
arr[left] = pivoKey;//把pivoKey赋值到中间
return left;
}
//递归划分子序列
public static void quickSort(int[] arr, int left, int right) {
if (left >= right) {
return;
}
int pivotPos = partition(arr, left, right);
quickSort(arr, left, pivotPos - 1);
quickSort(arr, pivotPos + 1, right);
}
public static void sort(int[] arr) {
if (arr == null || arr.length == 0)
return;
quickSort(arr, 0, arr.length - 1);
}
}
分析:
快速排序是通常被认为在同数量级(O(nlog2n))的排序方法中平均性能最好的。但若初始序列按关键码有序或基本有序时,快排序反而蜕化为冒泡排序。为改进之,通常以“三者取中法”来选取基准记录,即将排序区间的两个端点与中点三个记录关键码居中的调整为支点记录。快速排序是一个不稳定的排序方法。
4、归并排序
基本思想:
归并(Merge)排序法是将两个(或两个以上)有序表合并成一个新的有序表,即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列。
归并排序示例:
package com.dong.sortalgorithm;
/**
* author zhendong.Z
* version 2017-04-10 11:44
*/
/**
* 归并排序
*/
public class MergeSort {
public static void mergeSort(int[] arr) {
}
/**
* 递归分治
*/
public static void mSort(int[] arr, int left, int right) {
if (left >= right) {
return;
}
int mid = (left + right) / 2;
mSort(arr, left, mid);
mSort(arr, mid + 1, right);
merge(arr, left, mid, right);
}
/**
* 合并两个有序数组
*/
public static void merge(int[] arr, int left, int mid, int right) {
int[] temp = new int[right - left + 1];//中间数组
int i = left;
int j = mid + 1;
int k = 0;
while (i <= mid && j <= right) {
if (arr[i] <= arr[j]) {
temp[k++] = arr[i++];
} else {
temp[k++] = arr[j++];
}
}
for (int p = 0; p < temp.length; p++) {
arr[left + p] = temp[p];
}
}
}
5、基数排序
package com.dong.sortalgorithm;
/**
* author zhendong.Z
* version 2017-04-11 13:51
*/
import java.util.ArrayList;
import java.util.LinkedList;
import java.util.List;
/**
* 基数排序算法
*/
public class RadixSort {
public static void radixSort(int[] arr) {
if (arr == null && arr.length == 0) {
return;
}
int maxBit = getMaxBit(arr);
for (int i = 1; i <= maxBit; i++) {
List<List<Integer>> buf = distribute(arr, i);//分配
collecte(arr, buf);//收集
}
}
/**
* 待分配的数组
*/
public static List<List<Integer>> distribute(int[] arr, int iBit) {
List<List<Integer>> buf = new ArrayList<List<Integer>>();
for (int j = 0; j < 10; j++) {
buf.add(new LinkedList<Integer>());
}
for (int i = 0; i < arr.length; i++) {
buf.get(getNBit(arr[i], iBit)).add(arr[i]);
}
return buf;
}
/**
* 把分配的数据收集到arr中
*/
public static void collecte(int[] arr, List<List<Integer>> buf) {
int k = 0;
for (List<Integer> bucket : buf) {
for (int ele : bucket) {
arr[k++] = ele;
}
}
}
/**
* 获取最大位数
*/
public static int getMaxBit(int[] arr) {
int max = Integer.MIN_VALUE;
for (int ele : arr) {
int len = (ele + "").length();
if (len > max)
max = len;
}
return max;
}
/**
* 获取x的第n位,否则返回0
*/
public static int getNBit(int x, int n) {
String sx = x + "";
if (sx.length() < n) {
return 0;
} else {
return sx.charAt(sx.length() - n) - '0';
}
}
}
各种排序的稳定性,时间复杂度和空间复杂度总结: