大数据学习

大数据实时流处理识别结果  监控日志中实时的威胁行为
flume 采集数据  source ->channl ->sink 是一个agent   数据是一个event结构 head和body    
flink和spark流处理  所有的大数据的云计算能力,必须跟机器有关,内存大小和集群大小决定处理能力、
MapReduce、Spark只支持批处理任务  flink,Storm支持流处理任务  
flink和spark基于内存!!!   MapReduce基于硬盘运算    HBASE,HDFS分布式存储  YARN集群管理  sprakc支持交互式查询
流处理:实时要求高,只知道边界,不知道多久结束。  批处理:是一个文件或者excel,是一段时间的数据
 

项目实时输出处理 udp->flume->kafak->flink,spark->es

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值