大数据算法习题答案

自己整理,若是侵权请私信。6.11.为数T的每个结点标上子树大小的I/O复杂度为()。O (sort(N))2.前序计数的I/O复杂度为()。O (sort(N))3.对给定顶点邻接链表T,其一个欧拉回路可以以()IO复杂性求得。O(scan(N))IO4.外存算法最坏情况的I/O数位Ω(N)。() 错误5.图中的独立集是指图当中点的集合,其任意两点之间不存在边。()√6.21.查...
摘要由CSDN通过智能技术生成

自己整理,若是侵权请私信。

6.1
1.为数T的每个结点标上子树大小的I/O复杂度为()。O (sort(N))
2.前序计数的I/O复杂度为()。O (sort(N))
3.对给定顶点邻接链表T,其一个欧拉回路可以以()IO复杂性求得。O(scan(N))IO
4.外存算法最坏情况的I/O数位Ω(N)。() 错误
5.图中的独立集是指图当中点的集合,其任意两点之间不存在边。()√
6.2
1.查找规模为N的表L中,每个独立集(MIS)的大小至少为()。n/3
2.时间前向的处理方法是按照()来访问边。拓扑序
3.求最大独立集的基本思想是使用贪心法。()正确
6.3
1.图算法包含三种计数,其中将图问题表示为有向无环图的估值问题的是()
时间前向处理
2.半外存算法是假设()
顶点放在内存中,边在外面
3.图的连通性算法可扩增为求图G最小生成树(MST)的算法。()

4.在求最小生成树时,压缩后图中某条边的权值等于该边代表的所有边的权值最大值。()
错误
7.1
1.MapReduce是由()开发的分布式编程模型
Google
2.在实现MapReduce程序时,需要注意的事项不包括()
避免通信
3.MapReduce的执行框架处理的内容包括()
进行错误处理将中间数据进行聚集、排序或洗牌数据分布调度
4.理想的可扩展性有()
数据加倍,运行时间加倍资源加倍,运行时间减半
5.Map()和Reduce()两个函数不能够并行运行。()
错误
7.2
1.在版本1的字数统计中,在Map里使用了一个数组H,其作用是为每一个出现的单词作()
基数
7.3
1.大部分时候reducer不能用作combiner。()
正确
2.combiner的运行次数可能有多次
正确
7.4
1.关于单词共现矩阵的计算,说法正确的是()
是一种测量语义距离的方法语义距离可用于许多语言处理任务计算文本集合中词的共现矩阵
2.用单词共现矩阵解决大规模计数问题的基本方法是()
Reducer聚合部分计数Mapper生成部分计数
3.条纹法”的优点有()
对key-value对的排序和洗牌少得多能更好地利用combiner
4.在“词对法”中,每个mapper处理一个句子。()
正确
5.“词对法”的缺点是不易实现,排序和洗牌代价高。()
错误
6.f(B|A)词对法必须确定所有a被传递到同一个combiner。()
错误
8.1

  • 2
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值