大数据技术原理与应用第11讲:流计算

流计算秉承一个基本理念,即数据的价值随着时间的流逝而     ,如用户点击流。

 

A.不确定

B.不变

C.降低

D.升高

 

Hadoop运行的是MapReduce任务,类似地,Storm运行的任务叫做       。

A.Topology

B.Tuple

C.Spout

D.Bolt

 

 

对于一个流计算系统来说,它应达到如下哪些需求

A.海量式

B.高性能

C.可靠性

D.分布式

 

数据采集系统的基本架构包括哪些部分

A.Controller

B.Agent

C.Store

D.Collector

 

 

以下哪些是开源的流计算框架

A.Yahoo! S4

B.IBM InfoSphere Streams

C.Twitter Storm

D.Facebook Puma

 

Storm中的Stream Groupings有哪几种方式

A.直接分组

B.广播发送

C.按照字段分组

D.全局分组

 

 

Spark Streaming和Storm最大的区别在于:Spark Streaming无法实现毫秒级的流计算,而Storm可以实现毫秒级响应。

 

 

流计算处理过程一般包含三个阶段:数据实时采集,数据实时计算和实时查询服务

 

Spark Streaming最主要的抽象是DStream,中文全称是离散化数据流,表示连续不断的数据流。

 

Storm的流数据单位是 Tuple,Spark Streaming的流数据单位是DStream,Samza的流数据单位是消息。

 

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值