自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

dahaifeiyu的专栏

非主流的小象Hadoop

  • 博客(13)
  • 资源 (25)
  • 收藏
  • 关注

翻译 flumebase介绍(一)

1.介绍FlumeBase是一个建立在Flume之上的数据驱动的流处理系统。这个系统允许用户动态的向数据收集环境插入查询并且监控被Flume收集到的事件流。这些查询可能是抽样调查输入的数据,也可能是指定固定的监控,也可能是数据转换或者是质量过滤任务。这些查询是用一个类似于SQ

2011-09-30 14:42:34 1913

原创 Hadoop源代码分析之Configuration配置

最近也觉得应该仔细的看一下Hadoop的源代码了,以前只是懂得基本的架构了使用,最近在做一个系统,觉得很多东西可以借鉴MapReduce的可扩展性。但是当我们的系统的0.1版本出现的时候才发现我们的配置上很混乱。于是我自己的看了一下Hadoop的Configuration类,真的

2011-08-03 08:58:43 2548 1

翻译 Kafka消息订阅发布系统设计介绍

<br />Kafka学习总结<br />一、Kafaka简介<br />Kafka是一个分布式的消息发布-订阅系统。它的特性如下:<br />l  通过在O(1)的磁盘数据结构上提供消息持久化,对于即使数以TB的消息存储也能够保持长时间的稳定性能。<br />l  高吞吐:在商用机器上可以提供每秒数十万条的消息<br />l  支持在Kafaka服务器集群上进行messages分片,并在把messages在消费集群的机器上分配的同时维护每个分片的顺序信息。<br />l  支持将数据并行的加载到Hadoo

2011-05-31 08:23:00 5493

原创 Hadoop 集群的基准测试

<br />多节点集群性能测试手记<br />测试时间:2010年7月18日  测试地点:主楼B1-601测试人:王振飞<br />测试环境:<br />12个节点,每个节点的物理机配置为双核CPU,主频2.60Hz,<br />内存3G,硬盘250G,网络带宽100Mbps以太网,虚拟机VMware workstation 7.1.0 build-261024,平台RHEL5.5,内核版本2.6.18,,虚拟机配置为单核CPU,1G内存,Hadoop版本为0.20.2,在HDFS中每个文件块有3个备份。<

2011-03-03 11:20:00 2494 2

原创 Hadoop 集群的基准测试

<br />多节点集群性能测试手记<br />测试时间:2010年7月18日  测试地点:主楼B1-601测试人:王振飞<br />测试环境:<br />12个节点,每个节点的物理机配置为双核CPU,主频2.60Hz,<br />内存3G,硬盘250G,网络带宽100Mbps以太网,虚拟机VMware workstation 7.1.0 build-261024,平台RHEL5.5,内核版本2.6.18,,虚拟机配置为单核CPU,1G内存,Hadoop版本为0.20.2,在HDFS中每个文件块有3个备份。<

2011-03-03 11:19:00 3287

原创 Vsphere WebService SDk4.0编程环境搭建(上)

虚拟化技术是云计算的基础架构关键技术。在业界Vmware公司引领了虚拟化的技术发展和推广。Vmware公司推出的Vsphere是业界第一个云操作系统,从esx、esxi到Vcenter、vcloud,Vmware为计算提供了从基础架构比如存储、网络、CPU等的虚拟化到上层应用服务的虚拟化,再到有关资源、安全等方面的管理虚拟化。Vmware公司除了以上这些外,还为我们提供了在Vsphere上开发相关的应用的编程方法,即是Vsphere sdk,现在这个SDK提供了在Vsphere上开发应用的编程接口。SDK的

2010-08-08 23:40:00 2880 2

原创 Linux下升级相关组件的问题解决

最近在红帽子下进行一些工作,需要安装一些软件,但是软件对系统中的一些依赖类库等一些东西有版本要求,比如安装torque就需要Python2.5.1,而系统自带的Python版本却是2.4的,想卸载Python2.4安装Python2.5,但是还有其他的一些软件也依赖Python2.4,把它卸载后,那些软件将无法正常使用。

2010-07-26 00:41:00 1443

原创 Hadoop的优势介绍

初识Hadoop1.     大量的数据目前我们以每天很大的信息增长速度积累着大量的数据,其中包括个人数据和工业数据。衡量数据的单位的增长也说明了数据的快速街垒。GBTBPBZB 2.     数据分析通过大量数据的分析我们可以获得更多有价值的信息,但与此同时如何分析如此规模之大的数据也成了一个很大的问题。针对读写速度慢的问题,可以采用分布式存储的方式(HDFS)提高读写速度。针对硬件故障可以通过存储冗余数据的方式来解决。针对如何正确的把分布在不同存储地点的数据加以整合分析,可以通过mapreduce以键值

2010-07-16 11:47:00 4591

原创 edhat 5.4部署完全分布多节点Hadoop集群

多节点集群Hadoop平台的搭建部署是建立在前面所说的单节点Hadoop的基础上的,其搭建操作主要集中在master主机上,slave主机中只做很少的修改就好了。一、 单节点的搭建参照前面的文档在主机上首先实现单节点的搭建。并将单节点的虚拟机文件拷贝到每个要做节点的主机相应的目录上。这主要是保证每个节点的配置完全相同。二、 有关网络的一些配置在搭建过程中,首先联网一定要保证主机ip是固定的,无所谓使用的是无线网络还是有线网络。对于无线网络,可以使用手动指定ip的方式保证ip的固定。虚拟机与物理主机的联网采用

2010-06-05 21:32:00 1925

原创 redhat 5.4部署单机伪分布Hadoop集群

<br />2010-06-0<br />一、所需相关软件版本<br />RedHat enterprise 5.4,kernel 2.6.18; jdk 1.6update16.rpm.bin for linux;hadoop2.0.2,虚拟机VMware workstation 7.0.1 build-227600<br />二、设置RedHat<br />Rpm源:http://rpm.pbone.net/ (注:算是比较全的了,rpm包很集中,下载方便)<br />1. 解决中文乱码问题<br />

2010-06-05 21:26:00 5589

原创 硬盘安装win7中“安装程序无法创建系统分区,也无法定位系统分区”的问题!

因为笔记本的光驱坏了,一直装系统都是从硬盘上装,可是忽然有一次在按装win7的时候,提示“安装程序无法创建系统分区,也无法定位系统分区”的错误提示,按照网上的办法解决也没效果,后来把winpe里的安装工具都试了一下,有个NT6快速安装的软件,打开后按照提示安装竟然成了。以下是详细步骤。工具:杏雨梨云U盘系统,win7ISO安装镜像。1下载杏雨梨云U盘系统,制作U盘启动的winpe。2进

2010-05-03 18:27:00 17199 2

原创 偶有感悟,写小诗一首

                            像风一样走过,                    追上时间的脚步。                    身边一切都是过客,                     留下零碎的花絮。                    像风一样走过,                   比不上时光的速度。        

2010-04-17 13:27:00 837

原创 Java语言基础学习

      一直觉得所有的语言中Java是最好的,就开始学了起来。希望记下这些,对自己和以后的学习者有帮助!当然这只是我个人的一点学习感悟,大牛到此可绕过,如有看法,不吝赐教。      一门语言基本的逻辑结构和类型基本是一样的。所以我认为Java语言的基础学习应该从三方面入手,一个是你在程序中经常要操作的对象,比如各种数据类型,还有变量、数组、字符串等等,当然还有结构体、枚举或更重要的对象等

2010-04-17 12:06:00 1541 2

HBase:The Definition Guide,HBase权威指南完全版

HBase是基于Hadoop的面向列存储的数据库,是BigTable的开源实现,在FaceBook等大型公司中广泛应用。这本书是关于Hbase的一个详细的介绍。

2011-07-14

Hadoop in action

Hadoop的有一本权威著作,更侧重对Mapreduce的介绍,很全面,值得一看。是学习云计算和分布式的必读教材。

2010-11-15

文件状态检测Shell脚本

文件状态检测Shell脚本,可以用于测试一个文件大小的改变,是Unix课程实验的源代码

2010-06-15

用户检测Shell脚本

Unix实验程序源代码,用户检测程序,可以检测用户的登录情况

2010-06-15

ubuntu 10.04LTS正式版DVD版ISO镜像32位64位种子

Ubuntu最新10.04正式版,是有一个长期支持版本,新增了很多特性。

2010-04-30

ubuntu10.04 正式版种子

4月29日最新发布的Ubuntu10.04正式版,是有一个LTS长期支持的版本。

2010-04-29

redhat enterprise 5.5光盘镜像32位,64位种子

RedHat enterprise Linux最新版5.5,3月31日发布,这个是30天试用版,包含32位和64位及源代码,资源很好,速度很快,快来体验吧

2010-04-10

Google云计算的论文一gfs

这个是云计算巨头Google基于他自己的文件系统GFS发布的论文,也是目前很火的云计算开源框架Hadoop里的文件系统hdfs的前身,这个是翻译的中文版

2010-04-09

Hadoop on redhat enterprise 5.4部署安装手记

这个文档使我们小组搭建云计算平台的手记,为了平台的稳定性,选用了RedHat enterprise 5.4做虚拟机平台而不是网上所用的Ubuntu,绝对可用,内容记录很详细

2010-04-09

ubuntu9.10上部署Hadoop

云计算小组在ubuntu9.10上部署Hadoop参考资料,有详细的步骤和记录、问题分析

2010-03-16

计算机网络自顶向下与方法课后习题答案

电子科技大学计算机学院专业课,计算机网络自定向下方法,课后习题答案,rar格式

2010-03-16

Java电话计费卡程序源代码

Java实验,电话计费卡程序,编写一个程序可以测试电话通话的时间,并根据费率计费

2010-01-02

大学生职业规划和自我定位

大学新生四年的职业规划和自我定位论文,Word文档格式,原版原创,课程得分90分

2010-01-02

图书管理系统源代码 C语言

创建一个图书管理系统(包括每本书的编号、书名、作者、分类信息),程序采用交互式工作方式,流程如下: 书籍管理:完成增加新书籍和删除功能,并在完成操作之后按关键字(编号、书名、作者、种类)进行排序(插入、冒泡、快速、堆排序、归并排序等任选一种);现有如下书籍需要管理 二分法查找 冒泡排序 C语言描述

2010-01-02

信息安全数学基础课件

电子科技大学计算机学院信息安全专业核心课程,著名密码学教师原版课件,内容翔实丰富

2010-01-02

C语言描述 数据结构C语言描述课件

本课件是电子科技大学计算机学院数据结构课程的原版课件, PPT格式

2010-01-02

非常好用的截图工具,中文版

RAR格式的压缩包,解压后即可使用,操作简单,当时的扩大出口市场看到打算看到喀什

2009-06-04

三角形刚体平板绕质心轴的转动惯量

物理与工程09年02期 三角形刚体平板绕质心轴的转动惯量 PDF格式

2009-06-04

数据恢复实验信息安全方面

电子科技大学数据恢复实验,包含文档和PPT

2009-05-29

信息安全的数据恢复技术实验

电子科技大学信息安全的数据恢复实验,包含实验文档和PPT

2009-05-29

信息安全的数据恢复技术实验

电子科技大学信息安全实验之数据恢复技术,包含实验的文档和PPT

2009-05-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除