Hadoop
H_meiren0609
这个作者很懒,什么都没留下…
展开
-
Hadoop FS Shell命令
FS Shell 调用文件系统(FS)Shell命令应使用 bin/hadoop fs 的形式。 所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path 。对 HDFS文件系统,scheme是hdfs ,对本地文件系统,scheme是file 。其中scheme和 authority参数都是可选的,如果未加指定,就会使用配置中指定转载 2012-09-13 15:57:40 · 786 阅读 · 0 评论 -
Hadoop 源码解析
Hadoop 源码解析之-TextOutputFormat转载 2013-01-10 11:13:15 · 378 阅读 · 0 评论 -
hadoop中使用distributed cache遇到的问题
http://hugh-wangp.iteye.com/blog/1468989转载 2012-12-18 16:03:24 · 539 阅读 · 0 评论 -
Hadoop传递参数的方法总结
http://sishuok.com/forum/blogPost/list/5432.html;jsessionid=8F57D38617F957514BE30FD48BF96A9E 在MapReduce程序中向map和reduce函数传递参数的问题 http://blog.sina.com.cn/s/blog_6b7cf18f0100x9jg.html转载 2012-12-18 16:28:44 · 511 阅读 · 0 评论 -
MapReduce算法学习--Pairs和Stripes
http://www.cnblogs.com/koalaer/archive/2012/04/18/MapReduce_paris_stripes.html http://www.cnblogs.com/mdyang/archive/2011/06/29/data-intensive-text-prcessing-with-mapreduce-contents.html http://ww转载 2012-11-12 11:06:53 · 989 阅读 · 0 评论 -
关于ChainMapper的测试
hadoop api提供有ChainMapper和ChainReducer链式处理数据的接口,ChainMapper在一个map节点可以执行多个mapper逻辑,他们像unix管道一样,前一个map的输出作为后一个map的输入,直到最后一个map输出作为partition的输入,然后到reduce节点。而ChainReducer则不能从字面意义上理解为多个reduce连接起来处理数据,ChainR转载 2012-11-09 16:08:09 · 583 阅读 · 0 评论 -
Hadoop RPC详细分析
RPC(Remote Procedure Call Protocol)——远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在,如TCP或UDP,为通信程序之间携带信息数据 http://bbs.hadoopor.com/thread-329-1-2.html转载 2012-11-06 09:26:08 · 581 阅读 · 0 评论 -
Hive MetaStore(Mysql库表说明)
使用Mysql作为Hive metaStore的存储数据库。里面大约有20张库表。 其中主要涉及到的表如下: 表名 说明 关联键 TBLS 所有hive表的基本信息(表名,创建时间,所属者等) TBL_ID,SD_ID TABLE_PARAM 表级属性,(如是否外部表,表注释,最后修改时间等) TBL_ID COLUM转载 2012-10-23 10:02:05 · 1091 阅读 · 0 评论 -
Hive数据导入
可以通过多种方式将数据导入hive表 1.通过外部表导入 用户在hive上建external表,建表的同时指定hdfs路径,在数据拷贝到指定hdfs路径的同时,也同时完成数据插入external表。 例如: 编辑文件test.txt $ cat test.txt 1 hello 2 world 3 test 4 case 字转载 2012-10-23 11:21:34 · 778 阅读 · 0 评论 -
HDFS操作全记录
http://www.cnblogs.com/tommyli/archive/2012/01/13/2321663.html JAVA操作HDFS API(hadoop) http://www.cnblogs.com/alisande/archive/2012/06/06/2537903.html转载 2012-10-29 16:33:57 · 360 阅读 · 0 评论 -
MapReduce Shuffle介绍
原文链接地址: MapReduce:详解Shuffle过程 http://langyu.iteye.com/blog/992916 Hadoop的Shuffle分析 http://www.hadoop.so/hadoop/2012/0822/23.html转载 2012-10-19 09:10:46 · 351 阅读 · 0 评论 -
Hadoop学习网址(入门)
Hadoop集群(第9期) _MapReduce初级案例 http://www.cnblogs.com/xia520pi/archive/2012/06/04/2534533.html Linux下使用Eclipse开发Hadoop应用程序 http://blog.sina.com.cn/s/blog_62186b4601012acs.html原创 2012-09-20 16:00:52 · 298 阅读 · 0 评论 -
HDFS文件操作
HDFS是一种文件系统,存储着Hadoop应用将要处理的数据,类似于普通的Unix和linux文件系统,不同的是他是实现了google的GFS文件系统的思想,是适用于大规模分布式数据处理相关应用的、可扩展的分布式文件系统。它有以下优点: 1、在分布式存储中,经常会出现节点失效的情况,HDFS可以持续监视,错误检查,容错处理,自动恢复; 2、分布式存储的文件都是非常巨大的,HDFS重新规转载 2012-09-18 14:58:15 · 380 阅读 · 0 评论 -
分析Hadoop自带WordCount例子的执行过程(1)
http://blog.csdn.net/phinecos/article/details/4612002转载 2012-09-17 16:14:07 · 475 阅读 · 0 评论 -
hadoop中的DistributedCache
转载自:http://www.cnblogs.com/xuxm2007/archive/2011/06/29/2092145.html http://hadoop.apache.org/mapreduce/docs/r0.21.0/api/org/apache/hadoop/filecache/DistributedCache.html Distribute application转载 2013-01-24 19:43:55 · 764 阅读 · 0 评论