自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

笔尖的痕的专栏

don't be shy, just try!

  • 博客(4)
  • 资源 (13)
  • 收藏
  • 关注

转载 Hadoop2.2.0已经遗弃的属性名称

Hadoop自升级到2.x版本之后,有很多属性的名称已经被遗弃了,虽然这些被遗弃的属性名称目前还可以用,但是这里还是建议用新的属性名,主要遗弃的属性名称主要见下面表格:已经被遗弃属性的名称新的属性名称create.empty.dir.if.nonexistmapreduce.jobcontrol.createdir.ifnotexistdfs.a

2015-06-22 11:26:28 1656

转载 Hadoop开发常用的InputFormat和OutputFormat

在用hadoop的streaming读数据时,如果输入是sequence file,如果用“-inputformat org.apache.hadoop.mapred.SequenceFileInputFormat”配置读的话,读入的数据显示的话为乱码,其实是因为读入的还是sequence file格式的,包括sequencefile的头信息在内.改为“inputformat org.apache

2015-06-13 20:54:11 1124

转载 BloomFilter 简介及在 Hadoop reduce side join 中的应用

1、BloomFilter能解决什么问题?      以少量的内存空间判断一个元素是否属于这个集合, 代价是有一定的错误率 2、工作原理      1. 初始化一个数组, 所有位标为0,  A={x1, x2, x3,…,xm}  (x1, x2, x3,…,xm 初始为0)      2. 将已知集合S中的每一个数组, 按以下方式映射到A中           2.0  

2015-06-13 20:22:06 991 1

转载 MapReduce TotalOrderPartitioner 全局排序

我们知道Mapreduce框架在feed数据给reducer之前会对map output key排序,这种排序机制保证了每一个reducer局部有序,Hadoop 默认的partitioner是HashPartitioner,它依赖于output key的hashcode,使得相同key会去相同reducer,但是不保证全局有序,如果想要获得全局排序结果(比如获取top N, bottom N

2015-06-13 20:20:44 684

clickhouse官方文档PDF版本

clickhouse官方文档PDF版本哈。clickhouse官方文档PDF版本哈。

2018-10-12

apache spark的设计与实现

写的apache spark的设计与实现,共享给大家。

2016-02-03

openstack icehouse配置文件

自己配置的openstack icehouse的配置文件,有四个节点,集成了所有组件。供参考。

2014-10-07

hadoop-cdh4.6配置文件

hadoop-hbase-hive-zookeeper的cdh4.6.0和spark-0.9.0-incubating-bin-cdh4集群配置文件

2014-05-02

ext2Spring

基于extDirectSpring的源码,Jar包比较大所以删掉了,工程是基于extDirectSpring-1.3.8和spring-3.2.4,Jar包可以到网上下载,里面没勇嫂数据库。

2013-11-23

hadoopDemo-mapreduce

自己写的Hadoop的demo,是基于hadoop-2.0.0-cdh4.4.0的及其hadoop其他项目(hive,hbase,pig,zookeeper),Jar包自己找,然后下吧。本代码是基于集群配置的。

2013-11-13

Hadoop in Practice

Hadoop in Practice 是英文的书籍,有空要看看。

2013-11-05

Hadoop权威指南(中文版)

Hadoop权威指南,中文版的哈,很好的书,再看,是这方面最权威的书籍。

2012-04-23

集体智慧编程(中文版)

集体智慧编程(中文版),里卖弄有很都算法 都很好、很实用的算法。

2012-04-23

SQL.Server.MVP.Deep.Dives

学习SQL Server的书籍,是一本MVP们写的书哦。

2012-03-08

LINQ资料word版

LINQ属于C#语言的一部分 我认为这个资料是学习LINQ的好资料 LINQ很强大,哈哈

2012-02-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除