目录
一、排序的概念及引用
1、排序的概念
排序
:所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。
稳定性
:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j]
,且
r[i]
在
r[j]
之前,而在排序后的序列中,
r[i]
仍在
r[j]
之前,则称这种排序算法是稳定的;否则称为不稳定的。
内部排序
:数据元素全部放在内存中的排序。
外部排序
:数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。
2、排序运用
在平时的一些网页中,我们也能经常见到关于排序的运用,例如一些 知名大学之间的排序:
3、常见的排序算法
二、常见排序算法的实现
1、直接插入排序
(1)基本思想:
直接插入排序是一种简单的插入排序法,其基本思想是:
把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列
。实际中我们玩扑克牌时,就用了插入排序的思想。
(2)直接插入排序
当插入第
i(i>=1)
个元素时,前面的
array[0],array[1],…,array[i-1]
已经排好序,此时用
array[i]
的排序码与
array[i-1],array[i-2],…的排序码顺序进行比较,找到插入位置即将
array[i]
插入,原来位置上的元素顺序后移。
根据上述的直接插入排序的原则和思想,我们可以写出直接插入排序的代码:
//直接插入排序
/**
* 时间复杂度: 最好:O(N) 最坏:O(N^2)
* 空间复杂度: O(1)
* 稳定性:稳定的排序
* 当数据越有序,直接插入排序的效率越高
* @param array
*/
public static void insertSort(int[] array){
for (int i = 1;i < array.length;i++){
int tmp = array[i];
int j = i-1;
for (;j >= 0;j--){
if (array[j] >tmp){
array[j+1] = array[j];
}else {
//array[j+1] = tmp;
break;
}
}
array[j+1] = tmp;
}
}
直接插入排序的特性总结:
1. 元素集合越接近有序,直接插入排序算法的时间效率越高2. 时间复杂度: O(N^2)3. 空间复杂度: O(1) ,它是一种稳定的排序算法4. 稳定性:稳定
(3)希尔排序( 缩小增量排序 )
希尔排序法又称缩小增量法。希尔排序法的基本思想是:
先选定一个整数,把待排序文件中所有记录分成多个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后取gap值将数据进行分组,重复上述分组和排序的工作。当到达gap = 1时,所有记录在统一组内排好序
。
希尔排序的大致流程示意图如下:
public static void shell(int[] array,int gap){
//本质就是直接插入排序,把其中+1的地方改成gap
for (int i = gap;i < array.length;i++){
int tmp = array[i];
int j = i-gap;
for (;j >= 0;j = j-gap){
if (array[j] >tmp){
array[j+gap] = array[j];
}else {
//array[j+gap] = tmp;
break;
}
}
array[j+gap] = tmp;
}
}
希尔排序的特性总结:
1. 希尔排序是对直接插入排序的优化。2. 当 gap > 1 时都是预排序, 目的是让数组更接近于有序 。当 gap == 1 时,数组已经接近有序的了,这样就会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。3. 希尔排序的时间复杂度不好计算,因为 gap 的取值方法很多,导致很难去计算,因此在好些树中给出的希尔排序的时间复杂度都不固定:4. 稳定性:不稳定
2、选择排序
(1)基本思想:
每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完 。
(2)直接选择排序
1、在元素集合 array[i]--array[n-1] 中选择关键码最大 ( 小 ) 的数据元素2、若它不是这组元素中的最后一个 ( 第一个 ) 元素,则将它与这组元素中的最后一个(第一个)元素交换3、在剩余的 array[i]--array[n-2] ( array[i+1]--array[n-1] )集合中,重复上述步骤,直到集合剩余 1 个元素
public static void secleteSort(int[] array){
for (int i = 0;i < array.length-1;i++){
int minIndex = i;
for (int j = i + 1;j < array.length;j++){
if (array[j] < array[minIndex]){
minIndex = j;
}
}
int tmp = array[minIndex];
array[minIndex] = array[i];
array[i] = tmp;
}
}
【直接选择排序的特性总结】
1. 直接选择排序思考非常好理解,但是效率不是很好。实际中很少使用2. 时间复杂度: O(N^2)3. 空间复杂度: O(1)4. 稳定性:不稳定
(3)堆排序
堆排序
(Heapsort)
是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据。
需要注意的是排升序要建大堆,排降序建小堆。
堆排序即利用堆的思想来进行排序,总共分为两个步骤:
1.
建堆
升序:建大堆
降序:建小堆
2.
利用堆删除思想来进行排序。
建堆和堆删除中都用到了向下调整,因此掌握了向下调整,就可以完成堆排序
public static void heapSort(int[] array){
creatBigHeap(array);
int end = array.length - 1;
while (end > 0){
swap(array,end,0);
shifDown(array,0,end);
end--;
}
}
//建立大根堆
public static void creatBigHeap(int[] array){
for (int i = (array.length - 1 - 1)/2;i > 0;i--){
shifDown(array,i,array.length);
}
}
//向下调整
public static void shifDown(int[] array,int parent,int len){
int child = 2 * parent +1;
while (child < len){
while (child + 1 < len && array[child] < array[child + 1]){
child++;
}
if (child > parent){
swap(array,child,parent);
parent = child;
child = 2 * parent + 1;
}else{
break;
}
}
}
【堆选择排序的特性总结】
1. 堆排序使用堆来选数,效率就高了很多。2. 时间复杂度: O(N*logN)3. 空间复杂度: O(1)4. 稳定性:不稳定
3、交换排序
基本思想:所谓交换,就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置,
交换排序的特点是:将键值较大的记录向序列的尾部移动,键值较小的记录向序列的前部移动。
(1)冒泡排序
在之前学习C语言的时候我们就已经接触过冒泡排序了,因此在这里我们便用冒泡排序的图示简单的复习一下即可。
public static void bubbleSort(int[] array){
for (int i = 0;i < array.length-1;i++){
boolean flg = false;
for (int j = 0;j < array.length-1-i;j++){
if (array[j] > array[j + 1]){
swap(array,j,j+1);
flg = true;
}
}
if (!flg){
break;
}
}
}
【冒泡排序的特性总结】
1. 冒泡排序是一种非常容易理解的排序2. 时间复杂度: O(N^2)3. 空间复杂度: O(1)4. 稳定性:稳定
(2)快速排序
快速排序是
Hoare
于
1962
年提出的一种二叉树结构的交换排序方法,其基本思想为:
任取待排序元素序列中的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。
// 假设按照升序对array数组中[left, right)区间中的元素进行排序
void QuickSort(int[] array, int left, int right)
{
if(right - left <= 1)
return;
// 按照基准值对array数组的 [left, right)区间中的元素进行划分
int div = partion(array, left, right);
// 划分成功后以div为边界形成了左右两部分 [left, div) 和 [div+1, right)
// 递归排[left, div)
QuickSort(array, left, div);
// 递归排[div+1, right)
QuickSort(array, div+1, right);
}
上述为快速排序递归实现的主框架,发现与二叉树前序遍历规则非常像,同学们在写递归框架时可想想二叉树前序遍历规则即可快速写出来,后序只需分析如何按照基准值来对区间中数据进行划分的方式即可。
将区间按照基准值划分为左右两半部分的常见方式有:
1. Hoare法
public static int parttion(int[] array,int left,int right){
int tmp = array[left];
int i = left;
while (left < right){//还没有相遇
//一定要先检查后面的
while (left < right && array[right] >= tmp){//必须取等于号
right--;
}
while (left < right && array[right] <= tmp){
left++;
}
swap(array,left,right);
}
swap(array,left,i);//将0下标和相遇的位置进行交换
return left;//reuturn right也行
}
2. 挖坑法
public static int parttion2(int[] array,int left,int right){
int tmp = array[left];
while (left < right){//还没有相遇
//一定要先检查后面的
while (left < right && array[right] >= tmp){//必须取等于号
right--;
}
array[left] = array[right];
while (left < right && array[right] <= tmp){
left++;
}
array[right] = array[left];
}
array[left] = tmp;
return left;//reuturn right也行
}
3. 前后指针法
其中,关于前后指针法,常见的有两种写法,其代码分别如下:
第一种写法:
private static int partition(int[] array, int left, int right) {
int prev = left ;
int cur = left+1;
while (cur <= right) {
if(array[cur] < array[left] && array[++prev] != array[cur]) {
swap(array,cur,prev);
}
cur++;
}
swap(array,prev,left);
return prev;
}
第二种写法:
private static int partition(int[] array, int left, int right) {
int d = left + 1;
int pivot = array[left];
for (int i = left + 1; i <= right; i++) {
if (array[i] < pivot) {
swap(array, i, d);
d++;
}
}
swap(array, d - 1, left);
return d - 1;
}
快速排序优化
1.
三数取中法选
key
2.
递归到小的子区间时,可以考虑使用插入排序
public static int threeNode(int[] array,int left,int right){
int mid = (left + right) / 2;
if (array[left] < array[right]){
if (array[left] > array[mid]){
return left;
}else if(array[mid] > array[left]){
return right;
}else {
return mid;
}
}else {
if (array[mid] < array[right]){
return right;
}else if (array[mid] > array[right]){
return left;
}else {
return mid;
}
}
}
快速排序非递归
public static void quickSort2(int[] array){
Stack<Integer> stack = new Stack<>();
int start = 0;
int end = array.length-1;
/* if (end - start + 1 <= 20){
//直接插入排序
insertSort2(array,start,end);
return;//这个地方不能return ,否则相当于只排序了一部分
}*/
//三数取中
int mid = threeNode(array,start,end);
//交换
swap(array,mid,start);
int pivot = parttion(array,start,end);
if (pivot > start + 1){
stack.push(start);
stack.push(pivot -1);
}
if (pivot < end - 1){
stack.push(pivot + 1);
stack.push(end);
}
while (!stack.empty()){
end = stack.pop();
start = stack.pop();
if (end - start + 1 <= 20){
//直接插入排序
insertSort2(array,start,end);
return;
}
if (pivot > start + 1){
stack.push(start);
stack.push(pivot -1);
}
if (pivot < end - 1){
stack.push(pivot + 1);
stack.push(end);
}
}
}
【快速排序总结】
1. 快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫 快速 排序2. 时间复杂度: O(N*logN)3. 空间复杂度: O(logN)4. 稳定性:不稳定
4、归并排序
(1)基本思想
归并排序(
MERGE-SORT
)是建立在归并操作上的一种有效的排序算法
,
该算法是采用分治法(
Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
归并排序核心步骤:
public static void merge(int[] array,int left,int mid,int right){
int s1 = left;
int e1 = mid;
int s2 = mid + 1;
int e2 = right;
int[] tmpArr = new int[right - left + 1];
int k = 0;
while (s1 <= e1 && s2 <= e2){
if (array[s1] <= array[s2]){
tmpArr[k] = array[s1];
s1++;
k++;
}else {
tmpArr[k] = array[s2];
s2++;
k++;
}
}
//
while (s1 <= e1){
//把s1剩下全部元素放进
tmpArr[k++] = array[s1++];
}
while (s2 <= e2){
tmpArr[k++] = array[s2++];
}
for (int i = 0;i < k;i++){
array[i + left] = tmpArr[i];
}
}
【归并排序总结 】
1. 归并的缺点在于需要 O(N) 的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。2. 时间复杂度: O(N*logN)3. 空间复杂度: O(N)4. 稳定性:稳定
海量数据的排序问题
外部排序:排序过程需要在磁盘等外部存储进行的排序
前提:内存只有
1G
,需要排序的数据有
100G
因为内存中因为无法把所有数据全部放下,所以需要外部排序,而归并排序是最常用的外部排序
1.
先把文件切分成
200
份,每个
512 M
2.
分别对
512 M
排序,因为内存已经可以放的下,所以任意排序方式都可以
3.
进行
2
路归并,同时对
200
份有序文件做归并过程,最终结果就有序了