大数据原理与应用笔记

大数据、物联网,云计算共同构建了数据信息时代。

大数据的4个特性:大量化,多样化,快速化,价值密度低。

大数据技术的4个层次:数据采集,数据存储与管理,数据处理与分析,数据隐私与安全。

大数据的两大核心技术:分布式存储,分布式处理。

大数据典型的4个计算模式:批处理计算,流计算,图计算,查询分析计算。
批处理计算主要是针对大规模数据做批量处理,代表的技术产品有mapreduce、spark;
流计算是针对流数据的实时计算,代表的技术产品有storm、s4、flume等;
图计算是针对大规模图结构数据的处理,主要代表技术产品有:pregel、graphx等;
查询分析计算是针对大规模数据的存储管理和查询分析,主要代表技术产品有:hive、dremel、cassandra、impala;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值