- 博客(13)
- 资源 (25)
- 收藏
- 关注
翻译 flumebase介绍(一)
1.介绍FlumeBase是一个建立在Flume之上的数据驱动的流处理系统。这个系统允许用户动态的向数据收集环境插入查询并且监控被Flume收集到的事件流。这些查询可能是抽样调查输入的数据,也可能是指定固定的监控,也可能是数据转换或者是质量过滤任务。这些查询是用一个类似于SQ
2011-09-30 14:42:34 1913
原创 Hadoop源代码分析之Configuration配置
最近也觉得应该仔细的看一下Hadoop的源代码了,以前只是懂得基本的架构了使用,最近在做一个系统,觉得很多东西可以借鉴MapReduce的可扩展性。但是当我们的系统的0.1版本出现的时候才发现我们的配置上很混乱。于是我自己的看了一下Hadoop的Configuration类,真的
2011-08-03 08:58:43 2548 1
翻译 Kafka消息订阅发布系统设计介绍
<br />Kafka学习总结<br />一、Kafaka简介<br />Kafka是一个分布式的消息发布-订阅系统。它的特性如下:<br />l 通过在O(1)的磁盘数据结构上提供消息持久化,对于即使数以TB的消息存储也能够保持长时间的稳定性能。<br />l 高吞吐:在商用机器上可以提供每秒数十万条的消息<br />l 支持在Kafaka服务器集群上进行messages分片,并在把messages在消费集群的机器上分配的同时维护每个分片的顺序信息。<br />l 支持将数据并行的加载到Hadoo
2011-05-31 08:23:00 5493
原创 Hadoop 集群的基准测试
<br />多节点集群性能测试手记<br />测试时间:2010年7月18日 测试地点:主楼B1-601测试人:王振飞<br />测试环境:<br />12个节点,每个节点的物理机配置为双核CPU,主频2.60Hz,<br />内存3G,硬盘250G,网络带宽100Mbps以太网,虚拟机VMware workstation 7.1.0 build-261024,平台RHEL5.5,内核版本2.6.18,,虚拟机配置为单核CPU,1G内存,Hadoop版本为0.20.2,在HDFS中每个文件块有3个备份。<
2011-03-03 11:20:00 2494 2
原创 Hadoop 集群的基准测试
<br />多节点集群性能测试手记<br />测试时间:2010年7月18日 测试地点:主楼B1-601测试人:王振飞<br />测试环境:<br />12个节点,每个节点的物理机配置为双核CPU,主频2.60Hz,<br />内存3G,硬盘250G,网络带宽100Mbps以太网,虚拟机VMware workstation 7.1.0 build-261024,平台RHEL5.5,内核版本2.6.18,,虚拟机配置为单核CPU,1G内存,Hadoop版本为0.20.2,在HDFS中每个文件块有3个备份。<
2011-03-03 11:19:00 3287
原创 Vsphere WebService SDk4.0编程环境搭建(上)
虚拟化技术是云计算的基础架构关键技术。在业界Vmware公司引领了虚拟化的技术发展和推广。Vmware公司推出的Vsphere是业界第一个云操作系统,从esx、esxi到Vcenter、vcloud,Vmware为计算提供了从基础架构比如存储、网络、CPU等的虚拟化到上层应用服务的虚拟化,再到有关资源、安全等方面的管理虚拟化。Vmware公司除了以上这些外,还为我们提供了在Vsphere上开发相关的应用的编程方法,即是Vsphere sdk,现在这个SDK提供了在Vsphere上开发应用的编程接口。SDK的
2010-08-08 23:40:00 2880 2
原创 Linux下升级相关组件的问题解决
最近在红帽子下进行一些工作,需要安装一些软件,但是软件对系统中的一些依赖类库等一些东西有版本要求,比如安装torque就需要Python2.5.1,而系统自带的Python版本却是2.4的,想卸载Python2.4安装Python2.5,但是还有其他的一些软件也依赖Python2.4,把它卸载后,那些软件将无法正常使用。
2010-07-26 00:41:00 1443
原创 Hadoop的优势介绍
初识Hadoop1. 大量的数据目前我们以每天很大的信息增长速度积累着大量的数据,其中包括个人数据和工业数据。衡量数据的单位的增长也说明了数据的快速街垒。GBTBPBZB 2. 数据分析通过大量数据的分析我们可以获得更多有价值的信息,但与此同时如何分析如此规模之大的数据也成了一个很大的问题。针对读写速度慢的问题,可以采用分布式存储的方式(HDFS)提高读写速度。针对硬件故障可以通过存储冗余数据的方式来解决。针对如何正确的把分布在不同存储地点的数据加以整合分析,可以通过mapreduce以键值
2010-07-16 11:47:00 4591
原创 edhat 5.4部署完全分布多节点Hadoop集群
多节点集群Hadoop平台的搭建部署是建立在前面所说的单节点Hadoop的基础上的,其搭建操作主要集中在master主机上,slave主机中只做很少的修改就好了。一、 单节点的搭建参照前面的文档在主机上首先实现单节点的搭建。并将单节点的虚拟机文件拷贝到每个要做节点的主机相应的目录上。这主要是保证每个节点的配置完全相同。二、 有关网络的一些配置在搭建过程中,首先联网一定要保证主机ip是固定的,无所谓使用的是无线网络还是有线网络。对于无线网络,可以使用手动指定ip的方式保证ip的固定。虚拟机与物理主机的联网采用
2010-06-05 21:32:00 1925
原创 redhat 5.4部署单机伪分布Hadoop集群
<br />2010-06-0<br />一、所需相关软件版本<br />RedHat enterprise 5.4,kernel 2.6.18; jdk 1.6update16.rpm.bin for linux;hadoop2.0.2,虚拟机VMware workstation 7.0.1 build-227600<br />二、设置RedHat<br />Rpm源:http://rpm.pbone.net/ (注:算是比较全的了,rpm包很集中,下载方便)<br />1. 解决中文乱码问题<br />
2010-06-05 21:26:00 5589
原创 硬盘安装win7中“安装程序无法创建系统分区,也无法定位系统分区”的问题!
因为笔记本的光驱坏了,一直装系统都是从硬盘上装,可是忽然有一次在按装win7的时候,提示“安装程序无法创建系统分区,也无法定位系统分区”的错误提示,按照网上的办法解决也没效果,后来把winpe里的安装工具都试了一下,有个NT6快速安装的软件,打开后按照提示安装竟然成了。以下是详细步骤。工具:杏雨梨云U盘系统,win7ISO安装镜像。1下载杏雨梨云U盘系统,制作U盘启动的winpe。2进
2010-05-03 18:27:00 17199 2
原创 Java语言基础学习
一直觉得所有的语言中Java是最好的,就开始学了起来。希望记下这些,对自己和以后的学习者有帮助!当然这只是我个人的一点学习感悟,大牛到此可绕过,如有看法,不吝赐教。 一门语言基本的逻辑结构和类型基本是一样的。所以我认为Java语言的基础学习应该从三方面入手,一个是你在程序中经常要操作的对象,比如各种数据类型,还有变量、数组、字符串等等,当然还有结构体、枚举或更重要的对象等
2010-04-17 12:06:00 1541 2
HBase:The Definition Guide,HBase权威指南完全版
2011-07-14
redhat enterprise 5.5光盘镜像32位,64位种子
2010-04-10
Google云计算的论文一gfs
2010-04-09
Hadoop on redhat enterprise 5.4部署安装手记
2010-04-09
图书管理系统源代码 C语言
2010-01-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人