排序的概念及引用
排序概念
**排序:**所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作
**稳定性:**假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的
**内部排序:**数据元素全部放在内存中的排序。
**外部排序:**数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序
常见排序算法
常见的算法实现
笔记实现:默认升序
插入排序
直接插入排序
基本思想:
把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。
实际与打扑克类似
/**
* 直接插入排序
* 时间复杂度:O(N^2)
* 空间复杂度:O(1)
* 稳定性:稳定
* @param array 待排数据
*/
public void insertSort(int[] array){
for(int i = 1;i<array.length;i++){
int tmp = array[i];
int j = i-1;
for(;j>=0;j--){
if(array[j]>tmp){
array[j+1] = array[j];
}else{
break;
}
}
array[j+1] = tmp;
}
}
直接插入排序的特性总结:
- 元素集合越接近有序,直接插入排序算法的时间效率越高
- 时间复杂度:O(N^2)
- 空间复杂度:O(1),它是一种稳定的排序算法
- 稳定性:稳定
希尔排序
基本思想
先选定一个整数,把待排序文件中所有记录分成个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取,重复上述分组和排序的工作。当到达=1时,所有记录在统一组内排好序
/**
* 希尔排序
* 时间复杂度:平均O(N^1.3—N^2)
* 空间复杂度:O(1)
* 稳定性:不稳定
* @param array 待排数据
*/
public void shellSort(int[] array){
//分组
int grap = (array.length/3) + 1;
while(grap > 1){
//保证最后一次分组为一
grap = (grap/3)+1;
shell(array,grap);
}
}
private void shell(int[] array,int grap){
for(int i = grap;i < array.length;i++){
int tmp = array[i];
int j = i-grap;
for(;j>=0;j-=grap){
if(tmp < array[j]){
array[j+grap] = array[j];
}else {
break;
}
}
array[j+grap] = tmp;
}
}
希尔排序的特性总结:
- 希尔排序是对直接插入排序的优化。
- 当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时,数组已经接近有序的了,这样就会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。
- 希尔排序的时间复杂度不好计算,因为gap的取值方法很多,导致很难去计算,因此在好些树中给出的希尔排序的时间复杂度都不固定
因为咋们的gap是按照Knuth提出的方式取值的,而且Knuth进行了大量的试验统计,我们暂时就按照:
到
来算
- 稳定性:不稳定
选择排序
直接选择排序
基本思想
每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完
- 在元素集合array[i]–array[n-1]中选择关键码最大(小)的数据元素
- 若它不是这组元素中的最后一个(第一个)元素,则将它与这组元素中的最后一个(第一个元素交换
- 在剩余的array[i]–array[n-2](array[i+1]–array[n-1])集合中,重复上述步骤,直到集合剩余1个元素
/**
* 直接选择排序
* 时间复杂度:O(N^2)
* 空间复杂度:O(1);
* 稳定性:不稳定
* @param array 待排数据
*/
public void selectSort(int[] array){
for(int i = 0;i< array.length;i++){
for(int j = i+1;j<array.length;j++){
if(array[j] < array[i]){
swap(array,j,i);
}
}
}
}
//优化频繁的交换,只记录最小值下标,最后交换
public void selectSort2(int[] array){
for(int i = 0;i< array.length;i++){
int minIndex = i;
for(int j = i+1;j<array.length;j++){
if(array[j] < array[i]){
minIndex = j;
}
}
swap(array,minIndex,i);
}
}
private void swap(int[] array,int index1,int index2){
int tmp = array[index1];
array[index1] = array[index2];
array[index2] = tmp;
}
直接选择排序的特性总结
- 直接选择排序思考非常好理解,但是效率不是很好。实际中很少使用
- 时间复杂度:O(N^2)
- 空间复杂度:O(1)
- 稳定性:不稳定
堆排序
基本思想
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。
/**
* 堆排序
* 时间复杂度:O(N*logN)
* 空间复杂度:O(1)
* 稳定性:不稳定
* @param array
*/
public void heapSort(int[] array){
createHeap(array);
int end = array.length - 1;
while(end > 0){
swap(array,0,end);
shiftDown(array,0, end-1);
end--;
}
}
private void createHeap(int[] array){
for(int i = array.length-1;i>=0;i--){
shiftDown(array,i,array.length);
}
}
private void shiftDown(int[] array,int parent,int len){
int child = (2*parent)+1;
while(child < len){
if(child+1<len && array[child]<array[child+1]){
child++;
}
if(array[child] > array[parent]){
swap(array,parent,child);
parent = child;
child = (2*parent)+1;
}else{
break;
}
}
}
直接选择排序的特性总结
- 堆排序使用堆来选数,效率就高了很多。
- 时间复杂度:O(N*logN)
- 空间复杂度:O(1)
- 稳定性:不稳定
交换排序
基本思想:所谓交换,就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置。
交换排序的特点是:将键值较大的记录向序列的尾部移动,键值较小的记录向序列的前部移动。
冒泡排序
/**
* 冒泡排序
* 时间复杂度:O(N^2)
* 空间复杂度:O(1)
* 稳定性:稳定
* @param array
*/
public void bubbleSort(int[] array){
for (int i = 0; i < array.length-1; i++) {
boolean hasSwap = false;
for(int j = 0;j< array.length - i - 1;j++){
if(array[j] > array[j+1]){
swap(array,j,j+1);
hasSwap = true;
}
}
if(!hasSwap){
break;
}
}
}
冒泡排序的特性总结
-
冒泡排序是一种非常容易理解的排序
-
时间复杂度:O(N^2)
-
空间复杂度:O(1)
-
稳定性:稳定
快速排序
基本思想
任取待排序元素序列中的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止
主框架
// 假设按照升序对array数组中[left, right)区间中的元素进行排序
void QuickSort(int[] array, int left, int right)
{
if(right - left <= 1)
return;
// 按照基准值对array数组的 [left, right)区间中的元素进行划分
int div = partion(array, left, right);
// 划分成功后以div为边界形成了左右两部分 [left, div) 和 [div+1, right)
// 递归排[left, div)
QuickSort(array, left, div);
// 递归排[div+1, right)
QuickSort(array, div+1, right);
}
模拟实现
/**
* 快速排序
* 递归
* @param array
*/
public void quickSort1(int[] array){
quick(array,0, array.length-1);
}
private final int Max_InsertSort = 100;
/**
* 时间复杂度:最坏O(N^2) 最好O(N*logN)
* 空间复杂度:最坏O(n) O(logN)
* 稳定性:不稳定
* 优化方法: 三数取中,数据范围内的进行插入排序
* @param array 待排数据
* @param left 左下标
* @param right 右下标
*/
private void quick(int[] array,int left,int right){
if(left>=right){
return;
}
if(left-right+1 <= Max_InsertSort){
insertOfQuickSort(array,left,right);
return;
}
int pivot = partition1(array,left,right);
quick(array,left,pivot-1);
quick(array,pivot+1,right);
}
/**
* 快速排序
* 迭代
* 时间空间同递归
* @param array
*/
public void quickSort2(int[] array){
Stack<Integer> stack = new Stack<>();
int start = 0;
int end = array.length-1;
if(start >= end){
return;
}
//先入左,再入右
stack.push(start);
stack.push(end);
while(!stack.empty()){
//先出右,再出左
int right = stack.pop();
int left = stack.pop();
int pivot = partition1(array,left,right);
if(pivot < right-1){
stack.push(pivot+1);
stack.push(right);
}
if(pivot > left+1){
stack.push(left);
stack.push(pivot-1);
}
}
}
/**
*挖坑法
*/
private int partition1(int[] array,int left,int right){
int midIndex = getMid(array, left, right);
swap(array, left, midIndex);
int tmp = array[left];
while(left < right){
while(left<right && array[right]>=tmp){
right--;
}
array[left] = array[right];
while(left<right && array[left]<=tmp){
left++;
}
array[right] = array[left];
}
array[left] = tmp;
return left;
}
/**
*hoare版
*/
private static int partition(int[] array, int left, int right) {
int i = left;
int j = right;
int pivot = array[left];
while (i < j) {
while (i < j && array[j] >= pivot) {
j--;
}
while (i < j && array[i] <= pivot) {
i++;
}
swap(array, i, j);
}
swap(array, i, left);
return i;
}
private int getMid(int[] array,int left,int right){
int mid = (left+right)>>>1;
if (array[left] < array[right])
{
//a[mid] < a[left} < a[right]
if (array[mid] < array[left])
return left;
//a[left] < a[right] < a[mid]
else if (array[right] < array[mid])
return right;
//a[left] < a[mid] < a[right]
else
return mid;
}
else
{
//a[mid]<a[right]<a[left]
if(array[mid] < array[right])
return right;
//a[right]<a[left]<a[mid]
else if(array[left] < array[mid])
return left;
//a[right]<a[mid]<a[left]
else
return mid;
}
}
public void insertOfQuickSort(int[] array,int left,int right){
for(int i = left+1;i<=(right-left);i++){
int tmp = array[i];
int j = i-1;
for(;j>=left;j--){
if(array[j]>tmp){
array[j+1] = array[j];
}else{
break;
}
}
array[j+1] = tmp;
}
}
快速排序优化
-
三数取中法选key
-
递归到小的子区间时,可以考虑使用插入排序
快速排序总结
-
快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫快速排序
-
时间复杂度:O(N*logN)
-
空间复杂度:O(logN)
-
稳定性:不稳定
归并排序
基本思想
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide andConquer)的一个非常典型的应用。
将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。 归并排序核心步骤
/**
* 归并排序
* 时间复杂度:O(NlogN)
* 空间复杂度:O(N)
* 稳定性:稳定
* 递归
* @param array
*/
public void mergeSort1(int[] array){
mergeApart(array,0, array.length-1);
}
/**
* 分组
* @param array 数据
* @param left 左下标
* @param right 右下标
*/
private void mergeApart(int[] array,int left,int right){
if(left >= right){
return;
}
int pivot = (left+right)>>>1;
mergeApart(array,left,pivot);
mergeApart(array, pivot+1, right);
//归并
merge(array,left,pivot,pivot+1,right);
}
/**
* 归并
* @param array 数据
* @param s1 第一组 左下标
* @param e1 第一组 右下标
* @param s2 第二组 左下标
* @param e2 第二组 右下标
*/
private void merge(int[]array,int s1,int e1,int s2,int e2){
int[] tmp = new int[e2-s1+1];
int i = 0;
int s = s1;
while(s1<=e1 && s2<=e2){
if(array[s1] < array[s2]){
tmp[i++] = array[s1++];
}else {
tmp[i++] =array[s2++];
}
}
while(s1<=e1){
tmp[i++] = array[s1++];
}
while(s2<=e2){
tmp[i++] = array[s2++];
}
for (int k : tmp) {
array[s] = k;
s++;
}
}
/**
* 归并排序
* 非递归
* @param array
*/
public void mergeSort2(int[] array){
//每组个数
int grap = 1;
while(grap < array.length){
for (int i = 0; i < array.length; i+=grap*2) {
int left = i;
int mid = i+grap-1;
if(mid >= array.length){
mid = array.length-1;
}
int right = mid+1+grap-1;
if(right >= array.length){
right = array.length-1;
}
merge(array,left,mid,mid+1,right);
}
grap *= 2;
}
}
归并排序总结
-
归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。
-
时间复杂度:O(N*logN)
-
空间复杂度:O(N)
-
稳定性:稳定
海量数据的排序问题
外部排序:排序过程需要在磁盘等外部存储进行的排序
前提:内存只有 1G,需要排序的数据有 100G
因为内存中因为无法把所有数据全部放下,所以需要外部排序,而归并排序是最常用的外部排序
-
先把文件切分成 200 份,每个 512 M
-
分别对 512 M 排序,因为内存已经可以放的下,所以任意排序方式都可以
-
进行 200 路归并,同时对 200 份有序文件做归并过程,最终结果就有序了
排序算法复杂度及稳定性分析
排序方法 | 最好 | 平均 | 最坏 | 空间复杂度 | 稳定性 |
---|---|---|---|---|---|
冒泡排序 | O(n) | O(n^2) | O(n^2) | O(1) | 稳定 |
插入排序 | O(n) | O(n^2) | O(n^2) | O(1) | 稳定 |
选择排序 | O(n^2) | O(n^2) | O(n^2) | O(1) | 不稳定 |
希尔排序 | O(n) | O(n^1.3) | O(n^2) | O(1) | 不稳定 |
堆排序 | O(n * log(n)) | O(n * log(n)) | O(n * log(n)) | O(1) | 不稳定 |
快速排序 | O(n * log(n)) | O(n * log(n)) | O(n^2) | O(log(n)) ~ O(n) | 不稳定 |
归并排序 | O(n * log(n)) | O(n * log(n)) | O(n * log(n)) | O(n) | 稳定 |