Hadoop
文章平均质量分 67
laiahu
喜欢打篮球等
展开
-
(转)HDFS的JAVA接口API操作实例
HDFS的JAVA接口API操作实例转载 2011-05-30 13:35:00 · 1331 阅读 · 0 评论 -
(转)Zookeeper全解析——Paxos作为灵魂
来源: http://www.spnguru.com/2010/08/zookeeper%E5%85%A8%E8%A7%A3%E6%9E%90%E2%80%94%E2%80%94paxos%E7%9A%84%E7%81%B5%E9%AD%82/Zookeeper全解析——Paxos作为灵魂原计划在介绍完ZK Client之后就着手ZK Server的介绍,但是发现ZK Se转载 2012-07-24 17:06:22 · 1591 阅读 · 0 评论 -
CDH3 Installation Guide
来源: https://ccp.cloudera.com/display/CDHDOC/CDH3+Installation+GuideAbout this GuideThis CDH3 Installation Guide is for Apache Hadoop developers and system administrators interested in转载 2012-07-25 10:55:00 · 1012 阅读 · 0 评论 -
(转)HBase Installation
来源: https://ccp.cloudera.com/display/CDHDOC/HBase+InstallationContentsUpgrading HBase to the Latest CDH3 ReleaseStep 1: Perform a Graceful Cluster ShutdownStep 2. Stop the Zo转载 2012-07-25 14:51:39 · 2289 阅读 · 0 评论 -
(转)Linux alternatives命令
来源: http://blog.csdn.net/yuxinlong2006/article/details/6765327alternatives是Linux下的一个功能强大的命令。只能在root权限下执行。如系统中有几个命令功能十分类似,却又不能随意删除,那么可以用 alternatives 来指定一个全局的设置。alternatives常用于同一个系统中安装同一软件的多个转载 2012-07-26 09:39:54 · 1519 阅读 · 0 评论 -
ZooKeeper Installation
来源:https://ccp.cloudera.com/display/CDHDOC/ZooKeeper+Installation#ZooKeeperInstallation-InstallingtheZooKeeperServerPackageContentsUpgrading ZooKeeper to the Latest CDH3 ReleaseP转载 2012-07-26 17:36:49 · 3173 阅读 · 0 评论 -
(转)HBase 官方文档__中文版
来源:http://www.yankay.com/wp-content/hbase/book.html HBase 官方文档Copyright © 2010 Apache Software Foundation, 盛大游戏-数据仓库团队-颜开(译)Revision HistoryRevision 0.90.4 配置,数转载 2012-07-27 09:36:53 · 5198 阅读 · 0 评论 -
(转)HBase技术介绍
来源: http://www.searchtb.com/2011/01/understanding-hbase.htmlHBase简介HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源转载 2012-07-27 10:19:50 · 876 阅读 · 0 评论 -
bloom filter的开源实现程序memcached bloom filter
文章转自: http://www.heyues.com/mc_bloom_filter/google code 上的介绍IntroductionBloom filter 是由 Howard Bloom 在 1970 年提出的二进制向量数据结构,它具有很好的空间和时间效率,被用来检测一个元素是不是集合中的一个成员,被广泛使用于各种海量数据排转载 2012-12-05 16:12:11 · 1631 阅读 · 0 评论 -
深入理解Bloom Filter
文章转自: http://blog.csdn.net/liuben/article/details/6602683Bloom Filter是1970年由Bloom提出的,最初广泛用于拼写检查和数据库系统中。近年来,随着计算机和互联网技术的发展,数据集的不断扩张使得 Bloom filter获得了新生,各种新的应用和变种不断涌现。Bloom filter是一个空间效率很高的数据结转载 2012-12-05 16:01:00 · 985 阅读 · 0 评论 -
(转)十道海量数据处理面试题与十个方法大总结
海量数据处理:十道面试题与十个海量数据处理方法总结作者:July、youwang、yanxionglu。时间:二零一一年三月二十六日本文之总结:教你如何迅速秒杀掉:99%的海量数据处理面试题。有任何问题,欢迎随时交流、指正。出处:http://blog.csdn.net/v_JULY_v。---------------------------------------转载 2012-07-08 22:52:13 · 1485 阅读 · 0 评论 -
Using Hadoop Distributed Cache
来源:http://www.ashishpaliwal.com/blog/2012/04/using-hadoop-distributed-cache/Hadoop has a distributed cache mechanism to make available file locally that may be needed by Map/Reduce jobs. Thi转载 2012-06-20 10:33:59 · 2261 阅读 · 0 评论 -
(转载)基于Eclipse的Hadoop应用开发环境的配置
基于Eclipse的Hadoop应用开发环境的配置转载 2011-04-15 18:17:00 · 1007 阅读 · 0 评论 -
(转)HIVE中的自定义函数
文章来源: http://blog.csdn.net/wh62592855/article/details/6448722 hive默认的函数并不是太完整,以后我们使用的使用肯定需要自己补充一些。下面这个例子是个简单的测试,关于自定义函数的。函数代码p转载 2011-08-18 17:05:50 · 1422 阅读 · 0 评论 -
(l转)HDFS小文件问题及解决方法
来源:http://blog.csdn.net/needle2/article/details/6436343http://www.cloudera.com/blog/2009/02/the-small-files-problem/http://hi.chinaunix.net/?uid-9976001-action-viewspace-itemid-32134转载 2011-11-23 15:06:48 · 742 阅读 · 0 评论 -
(转)lzo文件的并行map处理
来源:http://share.blog.51cto.com/278008/663555https://github.com/kevinweil/hadoop-lzohttp://huntlife.blog.sohu.com/165889911.htmlHadoop集群中启用了lzo后,还需要一些配置,才能使集群能够对单个的lzo文件进行并行的map操作转载 2011-12-16 13:49:56 · 1535 阅读 · 0 评论 -
(转)hadoop jar xxxx.jar的流程
来源:http://hi.baidu.com/dtzw/blog/item/64a6f3f2dff0511eb17ec5b0.html搞清楚 hadoop jar xxxx.jar 执行的流程: jar文件是如何分发的JobClient(不一定是hadoop集群的节点)利用bin/hadoop脚本运行jar包,以hadoop-0.20.2-examples.jar为例子:hadoo转载 2011-12-27 10:23:34 · 3853 阅读 · 0 评论 -
maven将lib的依赖包也打进jar中
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">4.0.0com.chinacache.logstatHadoopLogStat原创 2011-12-27 11:46:17 · 14625 阅读 · 1 评论 -
独立jar中,在hadoop运行classpath问题
1.一种方式: 把lib依赖包、及配置文件都打进jar包,可以直接运行独立的程序jar,它会自动找到classpath.2.另一种方式: Hadoop独立的应用程序 的配置文件可以放在/home/dbrg/soft/hadoop-0.20.2/conf/下,这样就也可以找到classpath了原创 2011-12-29 15:51:26 · 6255 阅读 · 0 评论 -
(转)hadoop 命令手册
来源:http://blog.sina.com.cn/s/blog_5fbdba500100cy6d.html概述所有的hadoop命令均由bin/hadoop脚本引发。不指定参数运行hadoop脚本会打印所有命令的描述。用法:hadoop [--configconfdir] [COMMAND] [GENERIC_OPTIONS] [COMMAND_OPTIONS]Hado转载 2011-12-31 13:42:49 · 689 阅读 · 0 评论 -
(转)Clouder CDH3B3开始后hadoop.job.ugi不再生效
来源:http://blog.csdn.net/wf1982/article/details/6720043Clouder CDH3B3开始后hadoop.job.ugi不再生效!困扰了我好几天的,终于找到了原因。以前公司用的原版hadoop-0.20.2,使用java设置 hadoop.job.ugi为正确的hadoop用户和组即可正常访问hdfs并可创建删除等。转载 2012-02-13 18:15:46 · 1508 阅读 · 0 评论 -
Hadoop集群内lzo的安装与配置
学习地址:(重要)http://os.51cto.com/art/201104/256669.htm(重要)http://heipark.iteye.com/blog/1172759http://blog.chinaunix.net/space.php?uid=1838361&do=blog&id=2982485ant下载:http://mirror.bjtu.edu.转载 2011-11-03 17:27:04 · 3945 阅读 · 0 评论 -
yum安装cloudera hadoop等软件
来源:https://ccp.cloudera.com/display/CDHDOC/CDH3+Installationdownload:https://ccp.cloudera.com/display/SUPPORT/CDH+Downloads#CDHDownloads-CDH4PackagesandDownloadshttps://ccp.cloudera.com/di转载 2012-01-16 16:06:58 · 3068 阅读 · 0 评论 -
Partitioner, SortComparator and GroupingComparator in Hadoop
来源:http://roserouge.iteye.com/blog/746391hadoop 0.20.2 api里面,作业被重新定义到了类 org.apache.hadoop.mapreduce.Job。它有3个特别的方法:job.setPartitionerClass(Partitioner p);job.setSortComparatorClass(Ra转载 2012-06-20 10:07:25 · 1296 阅读 · 0 评论