自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 Hadoop分布式文件系统

Hadoop有一个被称为HDFS的分布式系统,全称为Hadoop Distributed FileSystem。HDFS是为以流式数据访问模式(一次写入,多次读取)存储超大文件(指几百MB,几百GB甚至几百TB大小的文件)而设计的文件系统,在商用硬件(在各种零售店都可以买到的普通硬件)的集群上运行。HDFS不适用的领域: ①低延迟数据访问(HDFS是为达到高数据吞吐量而优化的,这有可能会以延迟为代...

2012-03-08 15:49:06 106

原创 利用mapreduce求最大值

实现功能:随机生成10000个数字置于文件VInput中,利用mapreduce找出其中的最大值。我们需要三样东西:一个map函数,一个reduce函数,一些来运行作业的代码。求最大值实例的Mapper接口:import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.io.LongWr...

2012-03-08 15:46:46 1913

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除