- 博客(4)
- 资源 (5)
- 收藏
- 关注
原创 hadoop源码研读之路(四)----IPC.RPC
写这篇文章的时候比较吃力,因为我也不知道什么是IPC,基础知识太薄弱了。 进程间通信(IPC,Inter-Process Communication),指至少两个进程或线程间传送数据或信号的一些技术或方法。进程是计算机系统分配资源的最小单位。每个进程都有自己的一部分独立的系统资源,彼此是隔离的。为了能使不同的进程互相访问资源并进行协调工作,才有了进程间通信。这些进程可以运行在同一计算机上或网络连
2012-05-30 11:40:31 2036
原创 hadoop源码研读之路(三)----序列化
简单来说,序列化就是将对象(实例)转换为字符流(字符数组)的过程,转换后的字符流可用于网络传输或写入磁盘;相对的,反序列化就是将字符流转换成对象的过程。Hadoop有自己的序列化实现,并已提取为Avro子项目。序列化要求具有字符流紧凑,处理快速,可扩展,多语言支持特性。 Hadoop并没有采用Java的序列化,而是引入了它自己的系统。 Hadoop中定义了两个序列化相关的接口:Writable
2012-05-22 21:26:48 4105 1
原创 hadoop源码研读之路(二)----配置类
Configuration是org.apache.hadoop.conf包中的主类 Configuration类中包含了10个属性 private static final Log LOG = LogFactory.getLog(Configuration.class); LOG是记录日志的对象 private boolean quietmode = ture; quietmod
2012-05-15 21:43:17 1571 1
原创 Hadoop源代码研读之路(1)
首先,阅读过此文的朋友,希望你们能留下宝贵的意见。 此背景以hadoop-0.20.2为基础 解压完之后如下: /bin:包含一些集群的命令 /C++:应该是在hadoop上用C++开发的接口 /conf:hadoop的配置文件 /contrib:一些插件 /docs:说明文档 /ivy:不知道什么意思 /lib:一些架包 /librecordio:也不知道什么意思 /src
2012-05-14 11:49:04 1920
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人