自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

let it go的博客

知识需要记录

  • 博客(3)
  • 资源 (8)
  • 收藏
  • 关注

原创 Spark Streaming小程序试验-《单词统计》

1. 试验目标    a . 熟悉spark Streaming操作流程(编程-》打包-》程序提交运行-》job运行监控)    b. 熟悉spark Streaming 运行,和使用场景有初步了解    c .熟悉Spark Streaming基本编程,对spark函数有初步使用 ,flatMap,map,reduceByKey..2.前提 a . 软件安装:  nc(模拟数据实时输入工具),s...

2018-02-09 15:27:14 564

原创 linux sbt-1.1.0 安装

1.软件下载  官网下载:https://www.scala-sbt.org/download.html 下载 sbt-1.1.0.tgz 包(目前最新)。2.安装   安装在/usr/local/sbt目录下   [root@master ~]# mv sbt-1.1.0.tgz /usr/local/[root@master ~]#tar zxvf sbt-1.1.0.tgz [root@...

2018-02-09 00:28:04 2710 2

原创 利用ali OTTER 实时同步业务数据到数据仓库

1.背景     公司要求是某些业务报表达到实时标准,数据量最多的表大概400W+,报表逻辑复杂,计算一年24W数据,整个程个流程下来差不多一个小时,主要时间耗在全量数据同步跟计算上。年后大概实时需求会更多,数据量会更大,各分部数据到会到数据仓库。用脚本增量同步有限制,主要因为业务数据每天定时批量更新,周期是分钟,每次更新至少10W以上,脚本从下载数据到导入数据之后计算,流程复杂,时间太长。所以首...

2018-02-05 00:24:59 5325

Mapreduce 在windows运行文件

包中含有hadoop-eclipse-plugin-2.6.0.jar ,hadoop.dll,winutils.exe 三个文件,是windows 运行mapreduce 的配置文件。hadoop2.8.1亲测可用

2018-12-21

中文版JDK 1.6 ,1.8 api文档合集

JDK 1.6 中文API CHM版,1.8 中文API CHM版。

2018-12-04

sqlserver 20018 驱动

sqlserver 各种驱动下载网址,kettel 7.1 sqlserver 2008 native 驱动下载(sqljdbc4-2.0.jar),解决Driver class 'com.microsoft.sqlserver.jdbc.SQLServerDriver' could not be found, make sure the 'MS SQL Server (Native)' driver (jar file) is installed. com.microsoft.sqlserver.jdbc.SQLServerDriver问下,下载驱动,放入lib文件夹即可

2018-10-18

ms sql 驱动包(sqljdbc.jar 和jtds.jar)

linux 下kettle 连接sql server 必须要驱动包,MS SQL Server(Native) 对应sqljdbc.jar,MS SQL Server 对应jtds.jar 包。

2018-05-08

logstash-5.6.3.tar.gz

logstash-5.6.3.tar.gz ,kibanna测试数据accounts.zip,shakespeare.json,logs.jsonl.gz

2017-11-05

ELK 5.6.3 软件包集合(elasticsearch,kibana,filebeat)

包含elasticsearch-5.6.3.tar.gz,filebeat-5.6.3-linux-x86_64.tar.gz,kibana-5.6.3-linux-x86_64.tar.gz,logstsah 太大,在另外一个资源包内。

2017-11-05

《hadoop实战》第二版中文

作为云计算所青睐的分布式架构,Hadoop是一个用Java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,是谷歌实现云计算的重要基石。《Hadoop实战》分为3个部分,深入浅出地介绍了Hadoop框架、编写和运行Hadoop数据处理程序所需的实践技能及Hadoop之外更大的生态系统。  《Hadoop实战》适合需要处理大量离线数据的云计算程序员、架构师和项目经理阅读参考。

2017-09-14

pdksh-5.2.14

linux 软件包 pdksh-5.2.14

2013-04-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除