- 博客(3)
- 资源 (4)
- 收藏
- 关注
转载 Hadoop集群_MapReduce初级案例
1、数据去重 "数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。1.1 实例描述 对数据文件中的数据进行去重。数据文件中的每行都是一个数据。 样例输入如下所示: 1)file1:
2015-06-13 15:22:28 1197
原创 linux手动安装sbt过程
1、下载sbt通用平台压缩包:sbt-0.13.5.tgz http://www.scala-sbt.org/download.html 2、建立目录,解压文件到所建立目录$ sudo mkdir /opt/scala/sbt$ sudo tar zxvf sbt-0.13.5.tgz -C /opt/scala/ 3、建立启动sbt的脚本文件/*选定一个
2015-06-01 10:02:22 11531 1
原创 kafka的监控工具--kafka web console安装
概要Kafka Web Console是kafka的开源web监控程序.功能介绍如下:brokers列表连接kafka的zk集群列表所有topic列表,操作相应topic可以浏览查看相应message生产和消费流量图.1.下载Kafka Web ConsoleKafka Web Console2.安装sbta. centos : yum insta
2015-06-01 10:00:16 16088
tpch_2_14_3
2015-11-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人