自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

bluekeyv的专栏

12月 08月 05月 04月 03月

转载 mapreduce中控制mapper的数量

很多文档中描述，Mapper的数量在默认情况下不可直接控制干预，因为Mapper的数量由输入的大小和个数决定。在默认情况下，最终input占据了多少block，就应该启动多少个Mapper。如果输入的文件数量巨大，但是每个文件的size都小于HDFS的blockSize，那么会造成启动的Mapper等于文件的数量（即每个文件都占据了一个block），那么很可能造成启动的Mapper数量超出限制而导

2013-03-08 17:19:33 9609 1

原创 hbase使用、运维、改进(不断更新)

刚刚看了google jeff dean 在新的一年里发表的演讲，讲到各种系统配合使用完成海量数据处理任务。深有感触：http://t.cn/zYE89gn 。2013年，依然会专注hbase研究，并以此为基础扩展，对hbase衍生的一些特性和产品进行深入研究，例如replication、phoenix。从传统的离线计算（hadoop、hive），到实时流式计算系统（storm、s4），创新应用性

2013-03-07 15:27:06 12589 6

hbase培训ppt

本人总结的hbase入门+提高培训ppt，对于对初级人员进行hbase培训，讲解思路在我的一篇博文中：http://blog.csdn.net/kirayuan/article/details/6321966#reply

2013-05-22

控制原理课件和试卷完整版

考自控原理的非控制专业人员适用，考试必备。包含往届考试题目，来源华工计算机学院

2008-12-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

bluekeyv CSDN认证博客专家 CSDN认证企业博客

码龄16年

IP 属地：北京市

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

72: 原创

17万+: 周排名

196万+: 总排名

44万+: 访问

: 等级

4955: 积分

201: 粉丝

24: 获赞

82: 评论

38: 收藏

私信

关注

热门文章

分类专栏

技术感悟 1篇
hadoop 14篇
hbase 31篇
hive 3篇
java 14篇
linux 7篇
mapreduce 5篇
nosql 12篇
web技术 10篇
数据库技术 8篇
算法 3篇
solr 1篇
大数据云计算 2篇
实时计算 1篇
kudu 1篇

最新评论

hadoop2.0 HDFS搭建和HA切换
lmw0320: 1L代表什么意思呢？求指点。。
mapreduce中控制mapper的数量
一只懒得睁眼的猫: 看完作者写的，感觉写的有点不太对：splitSize = Math.max(minSize, Math.min(maxSize, blockSize))，如果输入文件size巨大，但不是小文件，如果想减少mapper任务的数量，可以通过增加mapred.max.split.size的数值，而不是增大mapred.min.split.size的值
java快速计算文本文件行数
江小白写bug: 少了一行，比正确的行数少一行
Hbase几种数据入库（load）方式比较
小强签名设计: 用mapreduce入库的时候不应该调用的是Tableoutputformat类吗，我看博主的代码好像没有用这个类啊。我想问问Tableoutputformat和HTable.put(put)有什么联系吗？
hbase二级索引
THECHINALION: 讲得非常好，谢谢！

最新文章

提示

确定要删除当前文章？

取消删除