分布式
文章平均质量分 82
engineer_qi
这个作者很懒,什么都没留下…
展开
-
Zookeeper简介
Zookeeper简介: 1.什么是Zookeeper? ZK是一个高效的分布式协调服务,他暴露了一些公用服务,比如命名、配置管理,同步控制,群组服务等,我们可以使用ZK实现比如达成共识,集团管理,leader选举等。 2.设计目标 简单:ZK中的namespace组织结构类似与标准的文件系统,通过这些共享的有层次的namespace来互相协调分布式...原创 2015-05-14 23:33:10 · 165 阅读 · 0 评论 -
hadoop0.20.2完全分布式安装和配置
苦一时,甜一辈子啊亲。。。刚巴德 完全分布式安装和配置 硬件环境: 虚拟机1号:master hostname: h1 IP:192.168.1.106 ==》用户名:hadoop ...原创 2015-08-15 16:27:36 · 143 阅读 · 0 评论 -
Mapreduce《案例之倒排索引》
Mapreduce《案例之倒排索引》源数据:1)file1: MapReduce is simple 2)file2: MapReduce is powerful is simple 3)file3: Hello MapReduce bye MapReduce 要实现的结果: 样例输出如下...原创 2015-08-15 16:36:13 · 165 阅读 · 0 评论 -
Mapreduce《案例之内连接》
Mapreduce《案例之内连接》 数据源:child parentTom LucyTom JackJone LucyJone JackLucy MaryLucy BenJack AliceJack JesseTerry AliceTerry JessePhilip TerryPhilip AlmaMark TerryMark...原创 2015-08-15 16:40:41 · 287 阅读 · 0 评论 -
Mapreduce《案例之两表连接》
Mapreduce《案例之两表连接》数据源:a.txt内容 addressed addressname1 Beijing2 Guangzhou3 Shenzhen4 Xian b.txt内容factoryname addressedBeijingRedStar 1ShenzhenThunder 3GuangzhouHonda 2Bei...原创 2015-08-15 16:44:56 · 227 阅读 · 0 评论 -
Mapreduce《案例之平均分》
Mapreduce《案例之数据排序》数据源:a.txt 内容:aaa 120bbb 100ccc 130ddd 150 b.txt内容:aaa 121bbb 101ccc 131ddd 150 c.txt内容aaa 119bbb 99ccc 129ddd 150 输出结果:aaa120bbb100...原创 2015-08-15 16:49:17 · 162 阅读 · 0 评论 -
Mapreduce《案例之数据去重复》
Mapreduce《案例之数据去重复》源数据:a.txt内容:2012-3-1 b2012-3-2 a2012-3-3 b2012-3-4 d2012-3-5 a2012-3-6 c2012-3-7 d2012-3-3 c b.txt内容:2012-3-1 a2012-3-2 b2012-3-3 c2012-3-4 d2012...原创 2015-08-25 17:16:19 · 225 阅读 · 0 评论