大数据
r6
这个作者很懒,什么都没留下…
展开
-
翻译:深入浅出 mahout
目录:深入浅出 mahout 001 序言翻译:深入浅出 mahout ——0002 第一部分 第一章翻译:深入浅出 mahout ——0003 第一部分 第二章翻译:深入浅出 mahout ——0004 第三部分 分类 第13章翻译 2013-03-20 21:22:18 · 536 阅读 · 0 评论 -
kafka在zk中的存储结构
视频讲解的URL:http://edu.51cto.com/course/course_id-2461.html涉及到的相关项目为kafka 0.8.1.1zookeeper 3.3.6环境下面的存储的结构图片中描述了kafka在zk中的存储结构,以及存储的相关数据,绿色代表的是zk的临时节点,当对应的进程退出后,此临时的znode将自动删除。由于consume原创 2014-11-25 19:41:08 · 622 阅读 · 0 评论 -
hadoop视频(讲师:r6)
童小军老师的hadoop培训视频: 分享地址:http://www.r66r.net/?p=369原创 2013-03-25 09:25:52 · 3452 阅读 · 8 评论 -
kafka的三种部署模式
kafka的3种部署模式的详细步骤。原创 2014-11-18 11:40:17 · 3493 阅读 · 0 评论 -
zookeeper 3.3.6 的集群方式部署安装图解
部署的架构模式安装步骤:原创 2014-11-18 09:39:57 · 463 阅读 · 0 评论 -
现代数据架构和Hadoop
原文链接:http://www.r66r.net/?p=1019为了迎接大数据的挑战,现代数据中心需要更低的成本,更高容量的基础设施,以补充现有的企业级数据仓库,的RDBMS和MPP系统。 Apache的Hadoop的 ,而Hortonworks数据平台 (HDP)满足这一需求。集成和兼容HDP设计工作沿着现有的数据中心基础设施,结合现有的ETL操作,提转载 2013-06-26 20:08:09 · 1249 阅读 · 0 评论 -
来自于yahoo的关于pig的介绍。
来自于yahoo的关于pig的介绍。Pig是Yahoo!捐献给Apache的一个项目,目前还在Apache孵化器(incubator)阶段,目前版本是v0.5.0。Pig是一个基于 Hadoop的大规模数据分析平台,它提供的SQL-like语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个转载 2013-06-24 09:08:57 · 506 阅读 · 0 评论 -
pig核心开发者对如何编写与执行脚本的介绍
本文作者:julienledemgithub的网址:https://github.com/julienledem/ 其中有一个项目https://github.com/julienledem/Pig-scripting-examples 是pig的一些编码,尤其是有队page rank的算法实现下面的ppt是其对pig的脚本开发的详细介绍twitter的地址: @julienled转载 2013-06-24 09:07:48 · 509 阅读 · 0 评论 -
Hadoop1.1.0中文在线手册
http://www.r66r.net/online_docs/hadoop/index.htmlHadoop文档下面的文档是一些概念介绍和操作教程,可帮助你开始使用Hadoop。如果遇到了问题,你可以向邮件列表求助或者浏览一下存档邮件。Hadoop快速入门Hadoop集群搭建Hadoop分布式文件系统Hadoop Map-Reduce教程Hadoop本地库API参考维基常见问转载 2013-06-19 13:57:32 · 568 阅读 · 0 评论 -
mysql5.1中文在线手册
1. 一般信息1.1. 关于本手册1.2. 本手册采用的惯例1.3. MySQL AB概述1.4. MySQL数据库管理系统概述1.4.1. MySQL的历史1.4.2. MySQL的的主要特性1.4.3. MySQL稳定性1.4.4. MySQL表最大能达到多少1.4.5. 2000年兼容性1.5. MaxDB数据库管理系统概述1.5.1. 什么是MaxDB?1.5.2. Max原创 2013-06-19 14:00:52 · 719 阅读 · 0 评论 -
Redis 中文命令参考
在线地址:http://www.r66r.net/redis-latest-api/index.html命令目录(使用 CTRL + F 快速查找):Key(键)DELKEYSRANDOMKEYTTLPTTLEXISTSMOVERENAMERENAMENXTYPEEXPIREPEXPIREEXPIREATPEXPIREATPERSISTSORTOBJEC转载 2013-06-19 10:40:13 · 486 阅读 · 0 评论 -
mahout实践
mahout实践001mahout分类算法的实践原创 2013-03-22 16:19:30 · 611 阅读 · 0 评论 -
Kafka在controller的代码设计
主要的核心类如下:controller :根据相关的上下文,创建KafkaController对象,引入多个监听器监听broker,topic,partition以及副本的状态变化。ZookeeperLeaderElector:主要负责选举当前broker为lead的过程,同时,如果出现异常情况转移lead选举权。ReplicaStateMachine:主要负责brok原创 2014-12-02 08:40:59 · 379 阅读 · 0 评论