那些年数组的排序

今天来回顾一下简单的排序思想,留作今后的复习和备份用。本篇是非常非常基础的,甚至都不会讲实际项目真正能用的排序方法,譬如双轴快速排序 。写的不好请多多谅解。

想要解锁更多新姿势?请访问http://blog.tengshe789.tech/

准备阶段

相关功能函数

为了保持代码的整洁,先创造好对数器和相关功能性函数。

交换器

两个数组中的元素比较排序过程中,一定会有元素的交换操作。为了保持代码的整洁,先写出交换操作的函数。

public static void swap(int[] arr, int i, int j) {
		arr[i] = arr[i] ^ arr[j];
		arr[j] = arr[i] ^ arr[j];
		arr[i] = arr[i] ^ arr[j];
	}
复制代码
随机样本产生器

自己编数组太麻烦了,让他自己生产吧

public static int[] generateRandomArray(int maxSize, int maxValue) {
		int[] arr = new int[(int) ((maxSize + 1) * Math.random())];
		for (int i = 0; i < arr.length; i++) {
			arr[i] = (int) ((maxValue + 1) * Math.random()) - (int) (maxValue * Math.random());
		}
		return arr;
	}
复制代码
对数器

对数器其实就是一个绝对正确但是复杂度不好的方法。

public static void comparator(int[] arr) {
		Arrays.sort(arr);
	}
复制代码

说说Arrays.sort()的逻辑吧。数组进入方法,先判断。如果数组的长度小于QUICKSORT_THRESHOLD(默认值是286)的话,再判断,如果数组长度小于INSERTION_SORT_THRESHOLD(值为47)的话,那么就会用插入排序 ,否则就会使用双轴快速排序。

如果大于286呢,它就会坚持数组的连续升序和连续降序性好不好,如果好的话就用归并排序,不好的话就用快速排序。

比较器

比较两个数组一不一样~

public static boolean isEqual(int[] arr1, int[] arr2) {
		if ((arr1 == null && arr2 != null) || (arr1 != null && arr2 == null)) {
			return false;
		}
		if (arr1 == null && arr2 == null) {
			return true;
		}
		if (arr1.length != arr2.length) {
			return false;
		}
		for (int i = 0; i < arr1.length; i++) {
			if (arr1[i] != arr2[i]) {
				return false;
			}
		}
		return true;
	}
复制代码
打印器
public static void printArray(int[] arr) {
   if (arr == null) {
      return;
   }
   for (int i = 0; i < arr.length; i++) {
      System.out.print(arr[i] + " ");
   }
   System.out.println();
}
复制代码
复制器
public static int[] copyArray(int[] arr) {
		if (arr == null) {
			return null;
		}
		int[] res = new int[arr.length];
		for (int i = 0; i < arr.length; i++) {
			res[i] = arr[i];
		}
		return res;
	}
复制代码
主函数
public static void main(String[] args) {
   int testTime = 500000;
   int maxSize = 100;
   int maxValue = 100;
   boolean succeed = true;
   for (int i = 0; i < testTime; i++) {
      int[] arr1 = generateRandomArray(maxSize, maxValue);
      int[] arr2 = copyArray(arr1);
      bubbleSort(arr1);
      comparator(arr2);
      if (!isEqual(arr1, arr2)) {
         succeed = false;
         break;
      }
   }
   System.out.println(succeed ? "牛逼,算法对了!" : "❌!");

   int[] arr = generateRandomArray(maxSize, maxValue);
   printArray(arr);
   bubbleSort(arr);//测试的算法
   printArray(arr);
}
复制代码

脑子

脑阔疼

正篇

基于比较的排序

冒泡排序

原理

冒泡排序算法的原理如下:

  1. 比较相邻的元素。如果第一个比第二个大,就交换他们两个。此时这两个数,永远是后面的数大。
  2. 第一回合将每一对相邻元素做同样的工作。回合结束后,最后的元素是整个数组最大的数。
  3. 第二回合...第n回合过程中,对除了最后一个元素重复以上的步骤。
实现
public static void bubbleSort(int[] arr) {
		if (arr == null || arr.length < 2) {
			return;
		}
		for (int end = arr.length - 1; end > 0; end--) {//end最后的数
			for (int i = 0; i < e; i++) {
				if (arr[i] > arr[i + 1]) {
					swap(arr, i, i + 1);//交换
				}
			}
		}
	}
复制代码
复杂度

时间复杂度:O(N²)

额外空间复杂度:O(1)

选择排序

原理

1.第一回合,将指针指向第一个元素,将第一个元素和剩余的元素比较,最小的元素放到一号位置。

2.第二回合...第n回合过程中,指针加一。对除了第一个元素重复以上的步骤。

实现
public static void selectionSort(int[] arr) {
   if (arr == null || arr.length < 2) {
      return;
   }
   for (int i = 0; i < arr.length - 1; i++) {
      int minIndex = i;
      for (int j = i + 1; j < arr.length; j++) {
         minIndex = arr[j] < arr[minIndex] ? j : minIndex;
      }
      swap(arr, i, minIndex);
   }
}
复制代码
复杂度

时间复杂度:O(N²)

额外空间复杂度:O(1)

插入排序的

原理

1.第一回合,比较第一个元素和第二个元素大小,大的放在第二个位置上

2.第二回合,将第三个元素与第二、第一个元素比较,大的放在第三个位置上

3.轮回

实现
public static void insertionSort(int[] arr) {
   if (arr == null || arr.length < 2) {
      return;
   }
   for (int i = 1; i < arr.length; i++) {
      for (int j = i - 1; j >= 0 && arr[j] > arr[j + 1]; j--) {
         swap(arr, j, j + 1);
      }
   }
}
复制代码
复杂度

时间复杂度:O(N²)

额外空间复杂度:O(1)

堆排序

堆其实就是完全二叉树,看堆要首先知道大顶堆、小顶堆。

每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。

大顶堆:arr[i] >= arr[2i+1] && arr[i] >= arr[2i+2]

小顶堆:arr[i] <= arr[2i+1] && arr[i] <= arr[2i+2]

原理

将待排序序列构造成一个大顶堆(升序采用大顶堆,降序采用小顶堆),此时,整个序列的最大值就是堆顶的根节点。将其与末尾元素进行交换,此时末尾就为最大值。然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值。如此反复执行,便能得到一个有序序列了

代码
public static void heapSort(int[] arr) {
		if (arr == null || arr.length < 2) {
			return;
		}
		//0-i之间生成大根堆这种结构
		for (int i = 0; i < arr.length; i++) {
			heapInsert(arr, i);
		}
		int size = arr.length;//定义数组大小,可以判断是否越界
		swap(arr, 0, --size);
		while (size > 0) {
			heapify(arr, 0, size);
			swap(arr, 0, --size);
		}
	}
	//生成大根堆这种结构
	public static void heapInsert(int[] arr, int index) {
		while (arr[index] > arr[(index - 1) / 2]) {//如果我这个节点比父节点大
			swap(arr, index, (index - 1) / 2);//交换
			index = (index - 1) / 2;//回到父位置继续
		}
	}
	//将数值小的元素往下沉
	public static void heapify(int[] arr, int index, int size) {
		int left = index * 2 + 1;
		while (left < size) {//左孩子在堆上,没越界
			int largest = left + 1 < size && arr[left + 1] > arr[left] ? left + 1 : left;//找出左右孩子中最大的数
			largest = arr[largest] > arr[index] ? largest : index;//和父比较
			if (largest == index) {
				break;
			}
			swap(arr, largest, index);
			index = largest;//回到较大节点
			left = index * 2 + 1;
		}
	}
复制代码
复杂度

如果只是建立堆的过程,时间复杂度为O(N)

时间复杂度O(N*logN)

额外空间复杂度O(1)

快速排序

快速排序不是一种稳定的排序算法,也就是说,多个相同的值的相对位置也许会在算法结束时产生变动。

假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。

原理

我先说说经典快排的思路吧。

将数组分成两部分,一部分是小于等于某个数的,一部分是大于等于某个数的。这两部分初始指针在数组的左(L)右(R)两头,此时L和R分别是一个边界点。

1.先定义less区域和more区域,代表比数组中某一个数更小更大的区域。初始less区域是L-1以左的部分,more区域是R以右的区域

2.第一回合,从数组左边开始。若L指针指的节点值小于某个数值,less区域向右移动一个位置 swap(arr,++less,L++);,L节点位置+1准备下一个回合;若它大于这个数值,more区域向左扩张一格,然后将这个节点放到more区域swap(arr,--more,L++);,L节点位置+1准备下一个回合;若他等于这个数值,什么也不管,只是L节点位置+1准备下一个回合。

3.重复上述过程,得到了一个数组,他的L指针右边时小于某个数的,R的右边时大于某个数的。[L,R]这个区间是等于某个数的。

4.返回这个都是相同数的数组的左边界、右边界

5.不断递归

经典快排有一个弊端。**左部分和右部分的规模不一样或者有一个部分规模特别大,算法效率会变差。**举个栗子,如果我有个数组[1,1,3,4,7,6,1,2,1,5,1,7],我指定的某个数字是7,那么那么排序后就变成了[1,1,1,1,1,2,3,4,5,6,7],经典快排结束后只搞定了一个一个区间(<7的区间),复杂度就从理想状态下的O(N)变成了O(N²)

然后就有了改进后的随机快排。

随机快排比经典快排多了一个选随机数的过程 swap(arr, L + (int) (Math.random() * (R - L + 1)), R);。就是随机生成某个数,这样生成的区间虽然也会出现上述经典快排的恶劣情况,但是此时的复杂度就从原来的恶劣事件变成了有概率恶劣事件,但总体期望是好的。这就变成了一个概率问题。

代码

以下为随机快排

//随机快速排序
    public static void quickSort(int[] arr) {
        if (arr == null || arr.length < 2) {
            return;
        }
        quickSort(arr, 0, arr.length - 1);
    }

    public static void quickSort(int[] arr,int L,int R){
        if (L<R){//将逻辑套在 L与R中
            swap(arr, L + (int) (Math.random() * (R - L + 1)), R);//随机数
            int[] p = partiton(arr,L,R);
            quickSort(arr, L, p[0] - 1);
            quickSort(arr, p[1] + 1, R);
        }
    }
    //返回等于区域的范围
    private static int[] partiton(int[] arr,int L,int R){
        int less = L-1;
        int more = R;
        while (arr[L] < R){
            if (arr[L] < more){
                swap(arr,++less,L++);
            }
            if (arr[L] > arr[R]){
                swap(arr,--more,L++);
            }else{
                L++;
            }
        }
        swap(arr,more,R);
        return new int[]{less+1,more-1};
    }
复制代码
复杂度

科学家数学证明,长期期望的时间复杂度为O(logN*N)

快速排序可以做到稳定性问题,非常难,要知道的可以谷歌“01 stable sort” ,反正我不会。

归并排序

原理

1.和上题一样,先定义左边界L右边界R数组中,然后定义一个中间值mid = (r-l)/2

2.递归,在边界内部不断的找中间值mid

实现
//归并排序
public static void mergeSort(int[] arr){
    if (arr==null || arr.length <2){
        return;
    }
    mergeSort(arr,0,arr.length-1);
}

private static void mergeSort(int[] arr, int l, int r) {
    if (l == r){
        return;
    }
    int mid = l + ((r - l) >> 1); //(r-l)/2
    mergeSort(arr,l,mid);
    mergeSort(arr,mid+1,r);
    merge(arr, l, mid, r);
}
复制代码
复杂度

时间复杂度O(N*logN)

额外空间复杂度O(N),归并排序的额外空间复杂度可以变成O(1),但是非常难,我没花时间研究,要知道的可以谷歌“归并排序 内部缓存法”

这里的时间复杂度怎么算出来的呢?有一个master定理

T(N) = a*T(N/b) + O(N^d)

其中 a >= 1 and b > 1 是常量,其表示的意义是n表示问题的规模,a表示递归的次数也就是生成的子问题数,b表示每次递归是原来的1/b之一个规模。 如下:

  1. log(b,a) > d -> 复杂度为O(N^log(b,a))

  2. log(b,a) = d -> 复杂度为O(N^d * logN)

  3. log(b,a) < d -> 复杂度为O(N^d)

这里,归并排序中b=2,a=2.

非基于比较的排序

非基于比较的排序,与被排序的样本的实际数据状况很有关系,所以实际中并不经常使用

桶排序

原理

1.找到一个数组中最大数的值

2.定义(最大数+1)个桶

3.将数组的数放到对应编号相同的桶中,每放进一个数,桶里面的数值加一

4.依次从小输出这个桶,桶里的元素出现几次就输出几个桶的编号

代码
// only for 0~200 value
	public static void bucketSort(int[] arr) {
		if (arr == null || arr.length < 2) {
			return;
		}
		int max = Integer.MIN_VALUE;
		for (int i = 0; i < arr.length; i++) {
			max = Math.max(max, arr[i]);
		}
		int[] bucket = new int[max + 1];
		for (int i = 0; i < arr.length; i++) {
			bucket[arr[i]]++;
		}
		int i = 0;
		for (int j = 0; j < bucket.length; j++) {
			while (bucket[j]-- > 0) {
				arr[i++] = j;
			}
		}
	}
复制代码
复杂度

时间复杂度O(N)

额外空间复杂度O(N)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值