Hadoop技术讲解:http://wenku.baidu.com/view/7df877bbfd0a79563c1e7239.html
Hadoop源码分析:http://caibinbupt.javaeye.com/blog/281281
Hadoop框架:http://wenku.baidu.com/view/020b93fdc8d376eeaeaa313b.html
Hadoop分布式文件系统:架构和设计要点:http://www.javaeye.com/topic/200508
Map/Reduce用户接口:http://blog.sina.com.cn/s/blog_62a9902f0100goxs.html
官方中文资料:http://hadoop.apache.org/common/docs/r0.20.2/cn/
Hadoop技术论坛:http://www.hadoopor.com/
中国科学院计算技术研究所:http://www.hadoopchina.org/
第一手资源
hadoop官方网站
hadoop.apache.org
最权威的官方资源之一
dev.yahoo.hadoop
hadoop.cn(偶尔有一些有用信息)
www.hadoop.org.cn
hadoopchina
手册
hdfs命令行指南
http://hadoop.apache.org/core/docs/current/commands_manual.html#fsck
官方文档
http://hadoop.apache.org/core/docs/r0.20.0/cn/
相关Blog
facebook工程师blog
http://www.facebook.com/note.php?note_id=76191543919&ref=mf
hadoop一个核心开发者的blog
http://www.lexemetech.com/2007/09/java-servlet-for-thrift.html
hadoop0.19特性归纳
http://solomons.javaeye.com/blog/277784
这个家伙很有意思,并且是研究hadoop的
http://www.blogjava.net/killme2008/archive/2008/06/05/206043.html
http://blog.csdn.net/ww_great/archive/2008/11/14/3296724.aspx
hadoop源码分析
http://blog.csdn.net/xymyeah/archive/2008/08/20/2802572.aspx
hadoop源码分析比较好的一篇文章
http://caibinbupt.javaeye.com/?show_full=true
源码分析,给了张package功能分析表
http://caibinbupt.javaeye.com/blog/270378
http://www.cnblogs.com/bjzhanghao/archive/2008/11/12/1325113.html
hadoop架构设计和要点
http://www.blogjava.net/killme2008/archive/2008/06/05/206043.html
讲述cascading
http://www.javaeye.com/news/3507-cascading-a-simple-application-of-hadoop-mapreduce
http://blog.rapleaf.com/dev/?p=33
淘宝数据仓库团队
http://rdc.taobao.com/blog/dw/archives/category/dw架构
http://hi.baidu.com/shirdrn/blog/category/Hadoop
hadoop初记,部分代码剖析
http://blog.csdn.net/kauu/archive/2006/12/10/1437207.aspx
hadoop源码剖析不错的
http://caibinbupt.javaeye.com/blog/292073
也研究MapReduce的家伙
http://coderplay.javaeye.com/blog/259880
相关主题和文档
hadoop部署
http://www.slideshare.net/steve_l/dynamic-hadoop-clusters
hadoop升级
http://zkl-1987.javaeye.com/blog/365172
http://www.javaeye.com/topic/365172
SequenceFile的demo
hadoop公平调度器的介绍ppt
DBInputFormat和DBOutputFormat的介绍
特殊应用WebDav, 这个家伙实现的hdfs-webdav
http://www.blogjava.net/badqiu/archive/2008/11/24/242225.html
http://markmail.org/search/?q=mapred.job.classpath.files
hadoop namenode 高可用性(容灾)(Redundant Network Architecture, 相关软件有: Linux bonding, heartbeat
, DRBD Disk
)
http://www.hadoop.org.cn/document/Hadoop%20Namenode%20High%20Availability.pdf
磁盘空间过满时启动失败的处理
http://blog.csdn.net/ww_great/archive/2008/11/14/3296724.aspx
写SequenceFile格式的输出
http://www.umiacs.umd.edu/~jimmylin/cloud9/umd-hadoop-dist/cloud9-docs/content/staging-records.html
Hadoop中的集群配置和使用技巧
http://www.infoq.com/cn/news/2008/08/hadoop-config-tip
MapReduce tips
http://www.javaeye.com/topic/351026
比较好的MR管道实例
http://www.cnblogs.com/phinecos/archive/2008/11/11/1331599.html
hadoop调试调优
http://business.rapleaf.com/pdfs/hadoop_part_3.pdf
hadoop in facebook(facebook的hadoop配置)
http://www.hadoop.org.cn/document/Anatomy%20of%20the%20Facebook%20Cluster.pdf
Practical MapReduce
http://www.cloudera.com/blog/2009/05/18/10-mapreduce-tips/
MISC
清华大学的分布式相关课程
http://hpc.cs.tsinghua.edu.cn/dpcourse/readings.htm
Hadoop是一个海量数据处理平台,
以下是非常高质量的学习Hadoop的入门文章 :
1. InfoQ上的分布式计算开源框架Hadoop介绍 分为三章,系统性的介绍了
Hadoop , HDFS结构、集群配置方法和编程。
2. IBM DeveloperWorks上的教程:用 Hadoop 进行分布式并行编程 ,也
Hadoop Eclipse Plugin.
是分为三部分(如果你找不到其他两部分,试着修改链接),讲述编程、集群配
置和
3.如果对Hbase感兴趣,可以看Hbase架构的中译文。
这个网站http://www.hadoop.org.cn/ 翻译了很多Hadoop相关的文章
from : http://hi.baidu.com/cqhwp/blog/item/0420aad2222f2a369b5027be.html