数据库-实现篇 第十六讲

两趟扫描算法的基本思想

  1. 整个关系一元操作的问题:任何一个元组需要与所有元组进行比较,才能确定最终结果。这些需要内存
    内存不够存储整个关系怎么办??——两趟 / 多趟算法
  2. 两趟算法基本思路:
    (1)第一趟:划分子集,使子集具有某种特性(有序/具有相同散列值)。处理好之后将结果写回磁盘
    将磁盘上的数据重新建立数据结构
    (2)处理全局性的内容操作。多子集归并、相同散列值操作
    在这里插入图片描述

两阶段多路归并排序 TPMMS

  1. (1)内排序问题:待排序数据可一次性装入内存中
    插入排序、选择排序、冒泡排序
    (2)外排序问题:待排数据不能一次性装入内存
  2. 算法思路:
    (1)第一趟:划分为子集合并子集排序
    (2)第二趟:各子集归并,纵向处理
  3. 算法复杂性:3B® / 4B®
  4. 算法应用条件:
    子集合数<Bmemory
    子集合块数<Bmemory
    大数据集块数<Bmemory*Bmemory

大数据集块数>Bmemory*Bmemory ,则可以采用多趟归并排序算法

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值