线性时间排序概述

桶排序

如果我们待排序的数据在一个区间内,可以使用分治的思想来排序。

例如:

如果给你要给一个10G的订单按照时间排序,此时的问题是你的内存只有几百MB,那么你该怎么办?

可以使用分治的思想。

把10G文件遍历一下,得到最小值和最大值,查看他们之间的相隔数。


例如:最小:2019/11/13 01:00:25。最大:2019/11/20 10:12:14

我们可以按照天来分割为7个桶,或者按照4小时分割42个桶。

假设我们选择第二种,遍历文件,从2019/11/13开始。

第一个桶放2019/11/13 00:00:00- 2019/11/13 04:00:00

依次递增。

这样就形成了42个文件。

对于每个文件,把该文件导入内存进行排序。

我们就得到了42个有序的文件。

由于这42个有序的文件之间也是有序的。

所以从第一个文件开始遍历,把所有的文件遍历输出到一个文件即可。

计数排序

这个排序适合数据在一定范围内的,比较集中的。

比如:我们的数据集中在[10, 15]

整个范围内存在的数据容量有15 - 10 + 1 = 6。总共有6个容量。

所以我们可以开辟一个数组大小为6的数组。

把每个数据放入对应的桶内。


例如:

存在数据[10,15,12,13,10,15,12]

那么我们开辟的数据存储的元素内容就为

[2,0,2,1,0,2]

表示:

10的个数,11的个数,12的个数...

这样遍历整个数组就可以得到对应的排序后的数据了。

基数排序

如果一组数据跨度较大,显然不适合使用计数排序,因为需要开辟的额外空间太多。

如果使用桶排序,显然效果也不会很好。

这个时候,基数排序就用上了。


例如:

待排序的数据为[1,10253,152,1674,24581369]

这样,我们可以先按照最后一位排序,因为每一位都在0-9的范围内,所以每一位可以使用计数排序。

那么就是这样:

第一次:[0, 1, 1, 1, 0, 0, 0, 0, 0, 1]

对应的:[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

按照这个顺序,把数据拿出来,就变为如下数据:

[1,152,10253,1674,24581369]

然后再比较倒数第二位,一直比较,没有的按照0来比较。

这样就可以实现跨度大的线性时间排序了。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值