- 博客(3)
- 资源 (8)
- 收藏
- 关注
原创 Spark Streaming小程序试验-《单词统计》
1. 试验目标 a . 熟悉spark Streaming操作流程(编程-》打包-》程序提交运行-》job运行监控) b. 熟悉spark Streaming 运行,和使用场景有初步了解 c .熟悉Spark Streaming基本编程,对spark函数有初步使用 ,flatMap,map,reduceByKey..2.前提 a . 软件安装: nc(模拟数据实时输入工具),s...
2018-02-09 15:27:14 564
原创 linux sbt-1.1.0 安装
1.软件下载 官网下载:https://www.scala-sbt.org/download.html 下载 sbt-1.1.0.tgz 包(目前最新)。2.安装 安装在/usr/local/sbt目录下 [root@master ~]# mv sbt-1.1.0.tgz /usr/local/[root@master ~]#tar zxvf sbt-1.1.0.tgz [root@...
2018-02-09 00:28:04 2710 2
原创 利用ali OTTER 实时同步业务数据到数据仓库
1.背景 公司要求是某些业务报表达到实时标准,数据量最多的表大概400W+,报表逻辑复杂,计算一年24W数据,整个程个流程下来差不多一个小时,主要时间耗在全量数据同步跟计算上。年后大概实时需求会更多,数据量会更大,各分部数据到会到数据仓库。用脚本增量同步有限制,主要因为业务数据每天定时批量更新,周期是分钟,每次更新至少10W以上,脚本从下载数据到导入数据之后计算,流程复杂,时间太长。所以首...
2018-02-05 00:24:59 5325
Mapreduce 在windows运行文件
2018-12-21
sqlserver 20018 驱动
2018-10-18
ms sql 驱动包(sqljdbc.jar 和jtds.jar)
2018-05-08
logstash-5.6.3.tar.gz
2017-11-05
ELK 5.6.3 软件包集合(elasticsearch,kibana,filebeat)
2017-11-05
《hadoop实战》第二版中文
2017-09-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人