JS核心原理 - 模块二 - sort排序方法的实现原理

JS核心原理

模块二 深入数组篇

sort排序方法的实现原理

思考:
	1、sort 方法到底是用了哪种排序思路?
	2、sort 方法里面的参数对比函数是什么意思?
sort 方法的基本使用
sort 方法是对数组元素进行排序,默认排序顺序是先将元素转换为字符串,然后再进行排序
arr.sort([compareFunction])
const months = ['March', 'Jan', 'Feb', 'Dec'];
months.sort();
console.log(months);
// ["Dec", "Feb", "Jan", "March"]

const array1 = [1, 30, 4, 21, 100000];
array1.sort();
console.log(array1);
// [1, 100000, 21, 30, 4]

如果想要按照从小到大排序或者从大到小排序,那么上面的代码就需要调整为下面这样
const array1 = [1, 30, 4, 21, 100000];
array1.sort((a,b) => b - a);
console.log(array1);    // [100000, 30, 21, 4, 1]

const array1 = [1, 30, 4, 21, 100000];
array1.sort((a,b) => a - b);
console.log(array1);    // [1, 4, 21, 30, 100000]

如果指明了 compareFunction 参数 ,那么数组会按照调用该函数的返回值排序,即 a 和 b 是两个将要被比较的元素:
1、如果 compareFunction(a, b)小于 0,那么 a 会被排列到 b 之前;
2、如果 compareFunction(a, b)等于 0,a 和 b 的相对位置不变;
3、如果 compareFunction(a, b)大于 0,b 会被排列到 a 之前。
sort 方法的底层实现
底层 sort 源码分析
通过研究源码我们先直接看一下结论,如果要排序的元素个数是 n 的时候,那么就会有以下几种情况:
1、当 n<=10 时,采用插入排序;
2、当 n>10 时,采用三路快速排序;
3、10<n <=1000,采用中位数作为哨兵元素;
4、n>1000,每隔 200~215 个元素挑出一个元素,放到一个新数组中,然后对它排序,找到中间位置的数,以此作为中位数。

1、为什么元素个数少的时候要采用插入排序?
虽然插入排序理论上是平均时间复杂度为 O(n^2) 的算法,快速排序是一个平均 O(nlogn) 级别的算法。但是别忘了,这只是理论上平均的时间复杂度估算,但是它们也有最好的时间复杂度情况,而插入排序在最好的情况下时间复杂度是 O(n)。
在实际情况中两者的算法复杂度前面都会有一个系数,当 n 足够小的时候,快速排序 nlogn 的优势会越来越小。倘若插入排序的 n 足够小,那么就会超过快排。而事实上正是如此,插入排序经过优化以后,对于小数据集的排序会有非常优越的性能,很多时候甚至会超过快排。因此,对于很小的数据量,应用插入排序是一个非常不错的选择。
2、为什么要花这么大的力气选择哨兵元素?
因为快速排序的性能瓶颈在于递归的深度,最坏的情况是每次的哨兵都是最小元素或者最大元素,那么进行 partition(一边是小于哨兵的元素,另一边是大于哨兵的元素)时,就会有一边是空的。如果这么排下去,递归的层数就达到了 n , 而每一层的复杂度是 O(n),因此快排这时候会退化成 O(n^2) 级别。
这种情况是要尽力避免的,那么如何来避免?就是让哨兵元素尽可能地处于数组的中间位置,让最大或者最小的情况尽可能少。这时候,你就能理解 V8 里面所做的各种优化了。
// 官方实现的 sort 排序算法的代码基本结构
function ArraySort(comparefn) {

	  CHECK_OBJECT_COERCIBLE(this,"Array.prototype.sort");

	  var array = TO_OBJECT(this);

	  var length = TO_LENGTH(array.length);

	  return InnerArraySort(array, length, comparefn);

}

function InnerArraySort(array, length, comparefn) {

  // 比较函数未传入

  if (!IS_CALLABLE(comparefn)) {

	    comparefn = function (x, y) {

	      if (x === y) return 0;

	      if (%_IsSmi(x) && %_IsSmi(y)) {

	        return %SmiLexicographicCompare(x, y);

	      }

	      x = TO_STRING(x);

	      y = TO_STRING(y);

	      if (x == y) return 0;

	      else return x < y ? -1 : 1;

	 };

  }

  function InsertionSort(a, from, to) {

    // 插入排序

    for (var i = from + 1; i < to; i++) {

	      var element = a[i];

	      for (var j = i - 1; j >= from; j--) {

	        var tmp = a[j];

	        var order = comparefn(tmp, element);

	        if (order > 0) {

	          a[j + 1] = tmp;

	        } else {

	          break;

	        }

	      }

	    a[j + 1] = element;

	 }

  }

  function GetThirdIndex(a, from, to) {   // 元素个数大于1000时寻找哨兵元素

    var t_array = new InternalArray();

	var increment = 200 + ((to - from) & 15);

	var j = 0;

	from += 1;

	to -= 1;

	for (var i = from; i < to; i += increment) {

	   t_array[j] = [i, a[i]];

	   j++;

	}

	t_array.sort(function(a, b) {

	   return comparefn(a[1], b[1]);

	});

	var third_index = t_array[t_array.length >> 1][0];

	return third_index;

  }

  function QuickSort(a, from, to) {  // 快速排序实现

        //哨兵位置

	    var third_index = 0;

	    while (true) {

	      if (to - from <= 10) {

	        InsertionSort(a, from, to); // 数据量小,使用插入排序,速度较快

	        return;

	      }

	      if (to - from > 1000) {

	        third_index = GetThirdIndex(a, from, to);

	      } else {

            // 小于1000 直接取中点

	        third_index = from + ((to - from) >> 1);

	      }

          // 下面开始快排

	      var v0 = a[from];

	      var v1 = a[to - 1];

	      var v2 = a[third_index];

	      var c01 = comparefn(v0, v1);

	      if (c01 > 0) {

	        var tmp = v0;

	        v0 = v1;

	        v1 = tmp;

	      }

	      var c02 = comparefn(v0, v2);

	      if (c02 >= 0) {

	        var tmp = v0;

	        v0 = v2;

	        v2 = v1;

	        v1 = tmp;

	      } else {

	        var c12 = comparefn(v1, v2);

	        if (c12 > 0) {

	          var tmp = v1;

	          v1 = v2;

	          v2 = tmp;

	        }

	      }

	      a[from] = v0;

	      a[to - 1] = v2;

	      var pivot = v1;

	      var low_end = from + 1; 

	      var high_start = to - 1;

	      a[third_index] = a[low_end];

	      a[low_end] = pivot;

	      partition: for (var i = low_end + 1; i < high_start; i++) {

	        var element = a[i];

	        var order = comparefn(element, pivot);

	        if (order < 0) {

	          a[i] = a[low_end];

	          a[low_end] = element;

	          low_end++;

	        } else if (order > 0) {

	          do {

	            high_start--;

	            if (high_start == i) break partition;

	            var top_elem = a[high_start];

	            order = comparefn(top_elem, pivot);

	          } while (order > 0);

	          a[i] = a[high_start];

	          a[high_start] = element;

	          if (order < 0) {

	            element = a[i];

	            a[i] = a[low_end];

	            a[low_end] = element;

	            low_end++;

	          }

	        }

	      }

          // 快排的核心思路,递归调用快速排序方法

	      if (to - high_start < low_end - from) {

	        QuickSort(a, high_start, to);

	        to = low_end;

	      } else {

	        QuickSort(a, from, low_end);

	        from = high_start;

	      }

	  }

  }


总结

在这里插入图片描述

将这两个排序的时间复杂度对比来看,如果当 n 足够小的时候,最好的情况下,插入排序的时间复杂度为 O(n) 要优于快速排序的 O(nlogn),因此就解释了这里当 V8 实现 JS 数组排序算法时,数据量较小的时候会采用插入排序的原因了。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不甜的糖果

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值