spark-stream:一、前置介绍

2 篇文章 0 订阅
2 篇文章 0 订阅

一、学习路线

1、视频以及网上资料

2、github示例学习

3、官网阅读

4、手动实现代码案例

二、spark版本介绍

maven339,java1.8

三、实时流处理

  1. 业务需求分析

    1. 统计主站每个(指定)课程访问的ip、地域信息分布
    2. 实现步骤
    3. 基于Hadoop实现方案
    4. 遇到问题如何解决
  2. 实时流处理背景

    1. 时效性高
    2. 数据量大                                                       
  3. 实时流处理概述

    1. 实时计算:响应时间短
    2. 流式计算
    3. 实时流式计算
  4. 离线计算与实时对比

    1. 数据来源:离线一般来源于hdfs,实时一般是消息队列,新增或修改的一批数据
    2. 处理过程:mapreduce-sparkstream
    3. 处理速度:慢和快
  5. 实时流处理框架对比

    1. ApacheStorm(真实时)
    2. Apach Spark Streaming(伪实时,有时间窗口)
    3. flink
  6. 实时流处理架构与技术选

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值