8种对快速排序等算法的优化_快速排序优化

最新推荐文章于 2024-06-12 14:18:49 发布

程序员8000

最新推荐文章于 2024-06-12 14:18:49 发布

阅读量366

点赞数 5

分类专栏：程序员文章标签： python 学习面试

本文链接：https://blog.csdn.net/2201_75604580/article/details/138890376

版权

程序员专栏收录该内容

173 篇文章 0 订阅

订阅专栏

现在能在网上找到很多很多的学习资源，有免费的也有收费的，当我拿到1套比较全的学习资源之前，我并没着急去看第1节，我而是去审视这套资源是否值得学习，有时候也会去问一些学长的意见，如果可以之后，我会对这套学习资源做1个学习计划，我的学习计划主要包括规划图和学习进度表。

分享给大家这份我薅到的免费视频资料，质量还不错，大家可以跟着学习

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

可以在交换的地方加一个标记，如果那一趟排序没有交换元素，说明这组数据已经有序，不用再继续下去。

// 冒泡排序优化一：连片有序而整体无序,eg:{1,2,3,4,5,7,6}
	public static void bubbleSort1(int[] arr) {
		boolean flag = true;// 定义一个标志，监测某一轮是否发生交换
		for (int i = 0; i < arr.length - 1; i++) {
			for (int j = 0; j < arr.length - i - 1; j++) {
				if (arr[j] > arr[j + 1]) {
					flag = false;
					int temp = arr[j];
					arr[j] = arr[j + 1];
					arr[j + 1] = temp;
				}
			}
			if (flag) {
				break;
			}
		}
	}

优化二：

**优化一仅仅适用于连片有序而整体无序的数据（例如：1，2，3，4，5，7，6）。但是对于前面大部分是无序而后面小半部分有序的数据（1，2，5，7，4，3，6，8，9，10）排序效率也不乐观，**对于这种数据类型，我们可以继续优化。即我们可以记下最后一次交换的位置，后边没有交换，必然是有序的，然后下一次排序从第一个比较到上一次记录的位置直至结束即可。

注：第二种优化不需要使用flag,比较多余，如果最后交换位置为0，就已经说明没有交换了

// 冒泡排序优化二：前面大部分无序而后面小半部分有序,eg:{1,2,5,7,4,3,6,8,9,10}
	public static void bubbleSort2(int[] arr) {
		for (int i = 0; i < arr.length - 1; i++) {// 轮数
			int end = arr.length - 1;
			int pos = 0;// 记录一轮中最后一次发生交换的位置
			for (int j = 0; j < end; j++) {// 次数
				if (arr[j] > arr[j + 1]) {
					int temp = arr[j];
					arr[j] = arr[j + 1];
					arr[j + 1] = temp;
					pos = j;
				}
			}
			end = pos;// 下一次比较到记录位置即可
		}
	}

优化三：

双向冒泡排序，又叫鸡尾酒排序：它的过程是：先从左往右比较一次，再从右往左比较一次，然后又从左往右比较一次，以此类推。

优点：能够再特定条件下，减少排序的回合数；缺点：代码量增大一倍。使用场景：大部分元素已经有序的情况下。

他是为了优化前面的大部分元素都已经排好序的数组，例如对于数组[2,3,4,5,6,7,8,1]如果使用普通的冒泡排序，需要比较7次；而换成双向冒泡排序，只需比较三次。

简单起见，先看下单纯的双向冒泡排序（没有结合前面两种优化）：

	// 冒泡排序优化三(双向冒泡排序)：大部分元素已经有序的情况下。{2,3,4,5,6,7,8,1}
	public static void bubbleSort3(int[] arr) {
		int temp = 0;
		for (int i = 0; i < arr.length / 2; i++) {
			// 奇数轮，从左向右比较和交换
			for (int j = i; j < arr.length - 1; j++) {
				if (arr[j] > arr[j + 1]) {
					temp = arr[j];
					arr[j] = arr[j + 1];
					arr[j + 1] = temp;
				}
			}
			// 偶数轮，从右向左比较和交换
			for (int j = arr.length - i - 1; j > i; j--) {
				if (arr[j] < arr[j - 1]) {
					temp = arr[j];
					arr[j] = arr[j - 1];
					arr[j - 1] = temp;
				}
			}
		}

最终优化：优化一 + 优化二 + 优化三

	// 最终优化：方式一 + 方式二 + 方式三
	public static void bubbleSort4(int[] arr) {
		int temp = 0;
		boolean flag = true;// 标志
		int leftEnd = 0;// 无序数列的左边界，每次比较只需要比到这里为止
		int rightEnd = arr.length - 1;// 无序数列的右边界，每次比较只需要比到这里为止
		int posLeft = 0;// 记录左侧最后一次交换的位置
		int posRight = 0;// 记录右侧最后一次交换的位置
		for (int i = 0; i < arr.length / 2; i++) {
			// 奇数轮，从左向右开始交换
			for (int j = leftEnd; j < rightEnd; j++) {
				if (arr[j] > arr[j + 1]) {
					temp = arr[j];
					arr[j] = arr[j + 1];
					arr[j + 1] = temp;
					flag = false;
					posRight = j;
				}
			}
			rightEnd = posRight;
			if (flag) {
				break;
			}
			flag = true;// 标志重置!!!!!!!!!!!!!!!!!!!!!!!!!
			// 偶数轮，从右向左开始交换
			for (int j = rightEnd; j > leftEnd; j--) {
				if (arr[j] < arr[j - 1]) {
					temp = arr[j];
					arr[j] = arr[j - 1];
					arr[j - 1] = temp;
					flag = false;
					posLeft = j;
				}
			}
			leftEnd = posLeft;
			if (flag) {
				break;
			}
		}
	}

选择排序及其优化

    /**
     * @param arr 选择排序
     */
    public static void selectionSort(int[] arr) {
        // 最开始，无序区间[0...n]  有序区间[]
        // 当无序区间只剩下一个元素时，整个集合已经有序
        for (int i = 0; i < arr.length - 1; i++) {
            // min变量存储了当前的最小值索引
            int min = i;
            // 从剩下的元素中选择最小值
            for (int j = i + 1; j < arr.length; j++) {
                if (arr[j] < arr[min]) {
                    min = j;
                }
            }
            // min这个索引一定对应了当前无序区间中找到的最小值索引，换到无序区间最前面i
            swap(arr,min,i);
        }
    }

优化点：一次排序过程中同时选出最大值和最小值,放在无序区间的最后和最前

    /**
     * @param arr 双向选择排序
     */
    public static void selectionSortOP(int[] arr) {
        int low = 0;
        int high = arr.length - 1;//[low,high]表示整个无序区间
        // low = high，无序区间只剩下一个元素，整个数组已经有序
        while (low <= high) {
            int min = low;
            int max = low;
            for (int i = low + 1; i <= high; i++) {
                if (arr[i] < arr[min]) {
                    min = i;
                }
                if (arr[i] > arr[max]) {
                    max = i;
                }
            }
            // min索引一定是当前无序区间的最小值索引，与low交换位置
            swap(arr,low,min);
            if (max == low) {//这个代码非常重要！！！！！！！！！！
                // 最大值已经被换到min这个位置
                max = min;
            }
            swap(arr,max,high);
            low += 1;
            high -= 1;
        }
    }

插入排序及其优化

* 每次从无序区间中拿第一个值插入到已经排序区间的合适位置，直到整个数组有序
* 在近乎有序的数据测试中，插入排序的性能好
* 极端情况下，当集合是一个(完全/近乎)有序的集合，插入排序内层循环一次都不走~~~
* 插入排序变为O(N)；因此，插入排序经常作为高阶排序算法的优化手段之一
* 插入排序是稳定的；arr[j] >= arr[j - 1]就停止了；相等的元素不会交换顺序，arr[j] < arr[j - 1]才交换

    /**
     * @param arr 直接插入排序
     */
    public static void insertionSort(int[] arr) {
        // 已排序区间[0,i)
        // 待排序区间[i...n]
        for (int i = 1; i < arr.length; i++) {
            // 待排序区间的第一个元素arr[i]
            // 从待排序区间的第一个元素向前看，找到合适的插入位置
//            for (int j = i; j > 0; j--) {
//                // arr[j - 1]已排序区间的最后一个元素
//                if (arr[j] >= arr[j - 1]) {
//                    // 相等我们也不交换，保证稳定性
//                    // 此时说明arr[j] > 已排序区间的最大值，arr[j]已经有序了~~直接下次循环
//                    break;
//                }else {
//                    swap(arr,j,j - 1);
//                }
//            }
            for (int j = i; j > 0 && arr[j] < arr[j - 1]; j--) {
                swap(arr,j,j - 1);
            }
        }
    }

优化点：因为插入排序中，每次都是在有序区间中选择插入位置 =>> 使用二分查找来定位元素的插入位置

    /**
     * @param arr 折半插入排序
     */
    public static void insertionSortBS(int[] arr) {
        // 有序区间[0..i)
        // 无序区间[i...n]
        // i表示当前正在处理的元素,有序区间和无序区间的分界线就是i
        for (int i = 1; i < arr.length; i++) {
            int val = arr[i];
            int left = 0;
            int right = i;
            while (left < right){
                int mid = left + ((right - left) >> 1);
                if (val < arr[mid]) {
                    right = mid;
                }else {
                    // val >= arr[mid]
                    left = mid + 1;
                }
            }
            // 搬移left..i的元素
            for (int j = i; j > left; j--) {
                arr[j] = arr[j - 1];
            }
            // left就是val插入的位置
            arr[left] = val;
        }
    }

归并排序及其优化

归并排序是一个稳定的nlogn排序算法

此处的稳定指的是时间复杂度稳定且归并排序也是一个稳定性排序算法

时间复杂度稳定：无论集合中的元素如何变化，归并排序的时间复杂度一直都是nlogn,不会退化为O(n^2)

    /**
     * @param arr 未优化的归并排序
     */
    public static void mergeSort(int[] arr) {
        mergeSortInternal(arr,0,arr.length - 1);
    }
    /**
     * 递归语义：在arr[l,r]进行归并排序,整个arr经过此函数后就是一个已经有序的数组
     */
    private static void mergeSortInternal(int[] arr, int l, int r) {
        if(l >= r){//左边的索引==右边的索引
            return;
        }
        int mid = l + ((r - l) >> 1);
        // 将原数组拆分为左右两个小区间，分别递归进行归并排序
        // 走完这个函数之后 arr[l..mid]已经有序
        mergeSortInternal(arr,l,mid);
        // 走完这个函数之后 arr[mid + 1..r]已经有序
        mergeSortInternal(arr,mid + 1,r);
        //merge
        merge(arr,l,mid,r);

    }
    /**
     * 合并两个子数组arr[l,mid]和arr[mid + 1,r]
     * 为一个大的有序数组arr[l,r]
     */
    private static void merge(int[] arr, int l, int mid, int r) {
        // 先创建一个新的临时数组aux
        int[] aux = new int[r - l + 1];
        // 将arr元素值拷贝到aux上
        for (int i = 0; i < aux.length; i++) {
            aux[i] = arr[i + l];
        }
        // i就是左侧小数组的开始索引
        int i = l;
        // j就是右侧小数组的开始索引
        int j = mid + 1;
        // k表示当前正在合并的原数组的索引下标
        for (int k = l; k <= r; k++) {
            if (i > mid) {
                // 左侧区间已经被处理完毕，只需要将右侧区间的值拷贝原数组即可
                arr[k] = aux[j - l];
                j ++;
            }else if (j > r) {
                // 右侧区间已经被处理完毕，只需要将左侧区间的值拷贝到原数组即可
                arr[k] = aux[i - l];
                i ++;
            }else if (aux[i - l] <= aux[j - l]) {
                // 此时左侧区间的元素值较小，相等元素放在左区间，保证稳定性
                arr[k] = aux[i - l];
                i ++;
            }else {
                // 右侧区间的元素值较小
                arr[k] = aux[j - l];
                j ++;
            }
        }
    }

归并排序的两点优化：

1.当左右两个子区间走完子函数后，左右两个区间已经有序了；如果此时arr[mid] < arr[mid + 1]

arr[mid]已经是左区间的最大值；arr[mid + 1]已经是右区间的最小值 => 整个区间已经有序了，没必要再执行merge过程

2.在小区间上，可以直接俄使用插入排序来优化，没必要元素一致拆分到1位置；r - l <= 15,使用插入排序性能是很好的。可以减少归并的递归次数

    public static void mergeSort(int[] arr) {
        mergeSortInternal(arr,0,arr.length - 1);
    }
    /**
     * 在arr[l,r]进行归并排序,整个arr经过此函数后就是一个已经有序的数组
     * 时间复杂度分析：
     * 递归的深度就是拆分数组所用的时间，就是树的高度（logN）
     * 合并两个子数组的过程merge；就是一个数组的遍历过程：O(n)
     */
    private static void mergeSortInternal(int[] arr, int l, int r) {
        if (r - l <= 15) {
            // 优化2.小区间直接使用插入排序
            insertionSort(arr,l,r);
            return;
        }
        int mid = l + ((r - l) >> 1);
        // 将原数组拆分为左右两个小区间，分别递归进行归并排序
        // 走完这个函数之后 arr[l..mid]已经有序
        mergeSortInternal(arr,l,mid);
        // 走完这个函数之后 arr[mid + 1..r]已经有序
        mergeSortInternal(arr,mid + 1,r);
        // 优化1.只有左右两个子区间还有先后顺序不同时才merge
        if (arr[mid] > arr[mid + 1]) {
            merge(arr,l,mid,r);
        }
    }
    /**
     * 合并两个子数组arr[l,mid]和arr[mid + 1,r]
     * 为一个大的有序数组arr[l,r]
     *
     为啥合并过程需要创建一个临时temp数组呢？
     防止在合并的过程中，因为小元素覆盖大的元素，丢失某些元素
     */
    private static void merge(int[] arr, int l, int mid, int r) {
        // 先创建一个新的临时数组temp
        int[] temp = new int[r - l + 1];
        // 将arr元素值拷贝到temp上
        for (int i = 0; i < temp.length; i++) {
            temp[i] = arr[i + l];
        }
        // i就是左侧小数组的开始索引
        int i = l;
        // j就是右侧小数组的开始索引
        int j = mid + 1;
        // k表示当前正在合并的原数组的索引下标
        for (int k = l; k <= r; k++) {
            if (i > mid) {
                // 左侧区间已经被处理完毕，只需要将右侧区间的值拷贝原数组即可
                arr[k] = temp[j - l];
                j ++;
            }else if (j > r) {
                // 右侧区间已经被处理完毕，只需要将左侧区间的值拷贝到原数组即可
                arr[k] = temp[i - l];
                i ++;
            }else if (temp[i - l] <= temp[j - l]) {
                // 此时左侧区间的元素值较小，相等元素放在左区间，保证稳定性！！！
                arr[k] = temp[i - l];
                i ++;
            }else {
                // 右侧区间的元素值较小
                arr[k] = temp[j - l];
                j ++;
            }
        }
    }
    /**
     * 在arr[l..r]使用插入排序
     * 归并优化调用了这个方法
     */
    private static void insertionSort(int[] arr, int l, int r) {
        for (int i = l + 1; i <= r; i++) {
            for (int j = i; j > l && arr[j] < arr[j - 1]; j--) {
                swap(arr,j,j - 1);
            }
        }
    }

快速排序及其优化

快速排序的基本思想是：通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列

快速排序的三个步骤：

1）选择基准：在待排序列中，按照某种方式挑出一个元素，作为 “基准”（pivot）

2）分割操作：以该基准在序列中的实际位置，把序列分成两个子序列。此时，在基准左边的元素都比该基准小，在基准右边的元素都比基准大

3）递归地对两个序列进行快速排序，直到序列为空或者只有一个元素。

优化一:优化选取基准点

对于分治算法，当每次划分时，算法若都能分成两个等长的子序列时，那么分治算法效率会达到最大。也就是说，基准的选择是很重要的。选择基准的方式决定了两个分割后两个子序列的长度，进而对整个算法的效率产生决定性影响。最理想的方法是，选择的基准恰好能把待排序序列分成两个等长的子序列

两种选择基准的方法

方法(1)：固定位置

思想：取序列的第一个或最后一个元素作为基准
注意：基本的快速排序选取第一个或最后一个元素作为基准。但是，这是一直很不好的处理方法。

思想：取序列的中间元素作为基准。

测试数据分析：如果输入序列是随机的，处理时间可以接受的。如果数组已经有序时，此时的分割就是一个非常不好的分割。因为每次划分只能使待排序序列减1，此时为最坏情况，快速排序沦为起泡排序，时间复杂度为O(n^2)。而且，输入的数据是有序或部分有序的情况是相当常见的。因此，使用某一个元素作为枢纽元是非常糟糕的，为了避免这个情况，就引入了下面两个获取基准的方法。

方法(2)：随机选取基准

引入的原因：在待排序列是部分有序时，固定选取枢轴使快排效率底下，要缓解这种情况，就引入了随机选取枢轴

思想：取待排序列中任意一个元素作为基准

int pivot = (int) (Math.random() * (r - l + 1)) + 1;

测试数据分析：:这是一种相对安全的策略。由于枢轴的位置是随机的，那么产生的分割也不会总是会出现劣质的分割。在整个数组数字全相等时，仍然是最坏情况，时间复杂度是O(n^{2）。实际上，随机化快速排序得到理论最坏情况的可能性仅为1/(2}n）。所以随机化快速排序可以对于绝大多数输入数据达到O(nlogn）的期望时间复杂度。

方法(3)：三数取中（median-of-three）

分析：最佳的划分是将待排序的序列分成等长的子序列，最佳的状态我们可以使用序列的中间的值，也就是第N/2个数。可是，这很难算出来，并且会明显减慢快速排序的速度。这样的中值的估计可以通过随机选取三个元素并用它们的中值作为枢纽元而得到。事实上，随机性并没有多大的帮助，因此一般的做法是使用左端、右端和中心位置上的三个元素的中值作为枢纽元。显然使用三数中值分割法消除了预排序输入的不好情形**，并且减少快排大约14%的比较次数**

举例：待排序序列为：8 1 4 9 6 3 5 2 7 0

左边为：8，右边为0，中间为6.

我们这里取三个数排序后，中间那个数作为枢轴，则枢轴为6

注意：在选取中轴值时，可以从由左中右三个中选取扩大到五个元素中或者更多元素中选取，一般的，会有（2t＋1）平均分区法（median-of-(2t+1)，三平均分区法英文为median-of-three）。

具体思想：对待排序序列中low、mid、high三个位置上数据进行排序，取他们中间的那个数据作为枢轴，并用0下标元素存储枢轴。

即：采用三数取中，并用0下标元素存储枢轴。

/**
	 * @return 取待排序序列中left、mid、right三个位置上数据，选取他们中间的那个数据作为枢轴
	 */
	public static int SelectPivotMedianOfThree(int arr[], int left, int right) {
		int temp = 0;
		int mid = left + ((right - left) >> 1);// 计算数组中间元素的元素的下标
		// 使用三数取中法选择枢轴
		if (arr[mid] > arr[right]) {// 目标：arr[mid] <= arr[right]
			temp = arr[mid];
			arr[mid] = arr[right];
			arr[right] = temp;
		}
		if (arr[left] > arr[right]) {// 目标：arr[left] <= arr[right]
			temp = arr[left];
			arr[left] = arr[right];
			arr[right] = temp;
		}
		if (arr[mid] > arr[left]) {// 目标：arr[left] <= arr[mid]
			temp = arr[mid];
			arr[mid] = arr[left];
			arr[left] = temp;
		}
		// 此时，arr[mid] <= arr[left] <= arr[right]
		// left的位置上保留这三个位置上大小为中间的值
		return arr[left];
	}

测试数据分析：使用三数取中选择枢轴优势还是很明显的，但是还是处理不了重复数组

优化二：当待排序序列的长度分割到一定大小后，使用插入排序

原因：对于很小和部分有序的数组，快排不如插排好。当待排序序列的长度分割到一定大小后，继

续分割的效率比插入排序要差，此时可以使用插排而不是快排

截止范围：待排序序列长度N = 10，虽然在5~20之间任一截止范围都有可能产生类似的结果，这

种做法也避免了一些有害的退化情形。摘自《数据结构与算法分析》Mark Allen Weiness 著

if (right - left + 1 < 10) {
			insertSort(arr);
			return;
}
//else正常的快速排序

测试数据分析：针对随机数组，使用三数取中选择枢轴+插排，效率还是可以提高一点，真是针对已排序的数组，是没有任何用处的。因为待排序序列是已经有序的，那么每次划分只能使待排序序列减一。此时，插排是发挥不了作用的。所以这里看不到时间的减少。另外，三数取中选择枢轴+插排还是不能处理重复数组

文末有福利领取哦~

👉一、Python所有方向的学习路线

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

👉二、Python必备开发工具

👉三、Python视频合集

观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

👉 四、实战案例

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。（文末领读者福利）

👉五、Python练习题

检查学习结果。

👉六、面试资料

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

👉因篇幅有限，仅展示部分资料，这份完整版的Python全套学习资料已经上传

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里获取

程序员8000

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
8种对快速排序等算法的优化_快速排序优化

现在能在网上找到很多很多的学习资源，有免费的也有收费的，当我拿到1套比较全的学习资源之前，我并没着急去看第1节，我而是去审视这套资源是否值得学习，有时候也会去问一些学长的意见，如果可以之后，我会对这套学习资源做1个学习计划，我的学习计划主要包括规划图和学习进度表。分享给大家这份我薅到的免费视频资料，质量还不错，大家可以跟着学习可以在交换的地方加一个标记，如果那一趟排序没有交换元素，说明这组数据已经有序，不用再继续下去。
复制链接

扫一扫