- 博客(4)
- 资源 (6)
- 收藏
- 关注
原创 Hadoop 中SequenceFile的简介
概念 SequenceFile是一个由二进制序列化过的key/value的字节流组成的文本存储文件,它可以在map/reduce过程中的input/output 的format时被使用。在map/reduce过程中,map处理文件的临时输出就是使用SequenceFile处理过的。 所以一般的SequenceFile均是在FileSystem中生成,供map调用的原始文件。
2014-12-10 22:33:09 11014
转载 几种序列化之间的比较Thrift&protocolbuffer&avro
thrift和avro都提供rpc服务和序列化,而protocolbuffer只是提供序列化功能 Avro是强调一种高效的序列化,标准性的云计算的数据交换和存储的Protocol Avro的创新之处在于融合了显式,declarative的Schema和高效二进制的数据表达,强调数据的自我描述,克服了以往单纯XML或二进制系统的缺陷。Avro对Schema动态加载功能,是Thrift编程接口所不
2014-12-05 15:37:07 1414
转载 Git简单入门教程
转载自:http://www.bootcss.com/p/git-guide/ 安装 下载 git OSX 版 下载 git Windows 版 下载 git Linux 版 创建新仓库 创建新文件夹,打开,然后执行 git init 以创建新的 git 仓库。 检出仓库 执行如下命令以创建一个本地仓库的克隆版本:
2014-12-02 10:28:26 993
原创 Openstack存储总结之:使用Ceph集群作为后端统一存储
前提条件 一个可以正常运行的Ceph集群,该集群采用ceph-deploy创建,dataprovider为管理节点,包括三个MON,四个MON 以及Openstack集群,其中Openstack集群假设Cinder,Glance都是安装在叫做controllernode的节点上,computernode,networknode分别为计算以及网络节点 创建Pool 在
2014-12-01 16:44:46 3598
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人