自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 大数据学习四-kafka生产数据、消费数据、结果存入redis流程

1.统一化管理配置 kafka.topic="topic5" kafka.group.id="kafka_group" kafka.broker.list="192.168.44.132:9092" redis.host="192.168.44.132" redis.db=1 redis.port=6379 kafka.checkpointdir="F:\\Bigdata\\checkpoin...

2020-03-31 00:22:14 1514

原创 大数据学习三:sparkstreaming中关于mapWithState、updateStateByKey、offset的学习

1.updateStateByKey 代码如下: //消费者配置,及读取日志过程省略.......... //输出数据格式,例如(20200328224742,(1,858,1)) li=(time,(flag.toInt,flag.toInt*fee.toInt,1)) // 这里是以时间为K,将K一样的V聚集成一个列表seq,当前K对应的状态V为state,然后只对V做运算,输出...

2020-03-30 02:14:46 401

原创 大数据学习二:sparkstreaming中关于Window窗体相关操作

1.窗口概念 1.1、.SparkStreaming之window滑动窗口应用,Spark Streaming提供了滑动窗口操作的支持,从而让我们可以对一个滑动窗口内的数据执行计算操作。每次掉落在窗口内的RDD的数据,会被聚合起来执行计算操作,然后生成的rdds。 1.2、每个滑动窗口操作都包含两个参数windowLength(窗口大小), slideInterval(窗口移动速率参数,即多久滑动...

2020-03-27 22:46:39 561

原创 大数据学习一:大数据(离线分析)-spark写入Hbase、mysql过程

1.过程说明: 数据为某网站的访问日志,格式如下: 110.85.18.234 - - [30/Jan/2019:00:00:21 +0800] "GET /course/list?c=cb HTTP/1.1" 200 12800 "www.imooc.com" "https://www.imooc.com/course/list?c=data" - "Mozilla/5.0 (Windows N...

2020-03-23 20:08:13 1046

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除