外部排序:如何排序10G个元素

手段:用扩展的归并排序

归并排序(一个稳定的排序)

将数据分为左右两半,分别归并排序,再把两个有序数据归并。
精髓在于不断选各个组最小的数。

K路归并

上面举的例子是二路归并,每次选两组数据头部最小的数据就可以了,仅仅比较一次,但是K路归并,也就是要选K组数据头部最小的数据就没有这么容易了 。我们要用到堆的数据结构,这个堆是个完全二叉树,根是树中最小的元素,子树的根也是子树的最小元素
库函数有PriorityQueue实现了这个堆算法
在这里插入图片描述
将归并好的数据送入归并节点也需要注意,因为归并节点的内存没有10G。解决办法就是每次把K组数据头部的最小的一批数据送入内存。
在这里插入图片描述
假如一组数据都被读完了就从硬盘/网络中再调一批。
我们发现管理缓冲区非常麻烦,这时就要使用iterable< T >的接口,这是一个位于内存和网络/文件间的一个接口,专门用来管理缓冲区
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值