自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 hadoop问题汇总

1、mapreduce处理的大文件是在什么地方被分隔为一个一个小文件的?2、hdfs中冗余备份文件在集群节点之间传递的方式?3、mr过程中要做几次排序操作?4、hadoop api中的数据类型有哪些?BooleanWritable 标准布尔型数值ByteWritable 单字节数值DoubleWritable 双字节数值FloatWritable 浮点数IntWri

2015-03-24 17:19:19 395

转载 Hadoop分块原则

Hadoop是怎么分块的http://blog.chinaunix.net/space.php?uid=20602285&do=blog&cuid=2273160 hadoop的分块有两部分,其中第一部分更为人熟知一点。 第一部分就是数据的划分(即把File划分成Block),这个是物理上真真实实的进行了划分,数据文件上传到HDFS里的时候,需要划分成一块一块,每块的大小由

2015-03-24 17:17:28 457

原创 各种字符匹配算法比较

各种字符匹配算法比较:package com.bj58.ranguisheng;/** * 字符匹配算法测试: * 输入是原字符串(String)和子串(又称模式,Pattern)组成,输出为子串在原字符串中的首次出现的位置 * @author Michael Ran * @version 2015年3月19日 下午4:17:16 * */public class KMP

2015-03-19 17:20:20 589

原创 大数据家族

大数据家族涉及哪些东西?hadoop家族:针对文本、社交媒体订阅以及视频等非结构化和半结构化的数据,包括分布是文件系统HDFS(GFS的一个开源实现),进行大数据处理的MapReduce架构。Nosql数据库:在大数据时代,传统的管系统结构化的数据库技术已经不能满足要求,在索引和高访问量的网站服务,在这些领域,Nosql数据库效率明显更好。内存分析:随着个人消费电子设备以及

2015-03-19 10:00:19 769

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除