自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

黑夜舞者的专栏

在黑夜中追逐梦想

  • 博客(12)
  • 资源 (20)
  • 收藏
  • 关注

原创 Hadoop中必须配置hostname的源码分析

搭建Hadoop的时候必须配置两个文件:/etc/sysconfig/network和/etc/hosts/etc/sysconfig/network的作用是设定机器的hostname/etc/hosts的作用是主机名与ip地址的匹配,如果没有DNS服务器的话,系统上的所有网络程序都通过查询该文件解析主机名对应的ip地址在Hadoop中,各个结点先通过getLocalHost()读

2016-03-24 14:14:21 3201

原创 MessagePack Java的使用

MessagePack是一个高效的二进制序列化格式。它让你像JSON一样可以在各种语言之间交换数据。但是它比JSON更快、更小。使用Maven添加MessagePack的依赖:org.msgpackmsgpack${msgpack.version}在本篇文章中使用的版本为0.6.6首先创建一个实体类UserInfo(注意对类加上Message注解)imp

2015-12-02 21:49:10 10217 3

原创 详解Java中的ThreadLocal、ThreadLocalMap和Thread之间的关系

每个ThreadLocal实例都有一个唯一的threadLocalHashCode(这个值将会用于在ThreadLocalMap中找到ThreadLocal对应的value值),它是通过静态变量nextHashCode和HASH_INCREMENT进行计算的,其中nextHashCode 和HASH_INCREMENT 的定义如下private static AtomicInteger nex

2015-11-18 02:49:49 7566 2

原创 Hadoop 2.X中的依赖Job

需要注意的是:JobControl类实现了Runnable接口,因此需要用一个Thread实例start启动它,不能直接用run方法具体代码片段见下面:@Overridepublic int run(String[] arg0) throws Exception {JobConf jobConfMediate = new JobConf(getConf(), TudouEpisod

2015-08-11 16:51:37 627

原创 Hadoop中的序列化:自定义value类型

NullWritable序列化不包含任何字符,仅仅相当于个占位符,在使用mapreduce时,key或者value在无需使用时,可以定义为NullWritablehadoop的value类型只需实现Writable接口,key类型需要实现WritableComparable接口自定义对象中有String字段时dataOutput.writeUTF(对象)用Text.writeStrin

2015-08-11 15:53:18 790

原创 maven中添加bundle类型的依赖包

众所周知,bundle是OSGI中的依赖单元,是一种特殊格式的jar,但我们同样可以在maven中使用bundle类型的依赖包,在maven中依赖bundle类型的包,需要加入处理bundle类型的插件,在pom.xml文件中添加如下的代码即可org.apache.felix      maven-bundle-plugin      true  这样我

2015-02-04 17:07:59 9152

原创 手动更新maven的central repository(亲测有效)

本文的操作在ubuntu 12.04系统下亲测有效,大家请放心使用,有什么问题可以讨论由于网络的问题,我们在线更新maven的central repository时,经常出错,因此就需要手动更新索引首先下载文件nexus-maven-repository-index.gz和nexus-maven-repository-index.properties(下载地址是http://pan.bai

2015-01-26 16:58:57 12216

原创 partitioner得到对应的reduce

我们知道每条数据在经过Map端的处理之后都会一个对应的partition号,从而被copy到指定号的Reduce中partition区分得到对应的reducer号:collector.collect(key,value, partitioner.getPartition(key, value, partitions))其中partitions的值这么得到:partitions = jobC

2014-10-27 09:00:19 598

原创 MapReduce中跨InputSplit数据的处理

LineRecordReader类的分析InputSplit只是一个逻辑概念,每个InputSplit并没有对文件进行实际的切割,只是记录了要处理的数据的位置,首先说明InputSplit的生成:一、bytesRemaining = length,length为文件的大小,bytesRemaining初始化的值为文件的大小二、生成blockIndex,blkIndex =getBloc

2014-10-10 08:43:02 924

原创 Map数量的修改-computeSplitSize

Class JobSubmittersubmitJobInternal(Jobjob, Cluster cluster)int maps = writeSplits(job,submitJobDir)  private int writeSplits(org.apache.hadoop.mapreduce.JobContextjob,      Path jobSubmitDi

2014-09-11 16:50:24 648

原创 job.waitForCompletion的具体流程

Job运行是通过job.waitForCompletion(true),true表示将运行进度等信息及时输出给用户,false的话只是等待作业结束Job对象有两种状态:DEFINE和RUNNING,是通过JobState枚举类定义的public static enum JobState {DEFINE,RUNNING}当一个对象创建时,state状态被声明为DEFINEpr

2014-08-27 17:34:38 19336 2

原创 Mapper中map方法下context.write的流程与代码详解

本文的分析基于Hadoop 2.4.0版本Mapper abstract class Context implements MapContext(接口)Reducer的abstract class Context implements ReduceContext(接口)MapContext和ReduceContext都是extends TaskInputOutputCont

2014-08-22 19:46:57 13463 2

学习中总结的一些文档

自己平时整理的一些资料,供大家参考使用,里面有很多自己总结的一些经验,包括FTP配置,Linux的使用,Derby数据库的使用以及各种可能会对各位开发有帮助的资料

2015-01-16

网页正则标签抽取例子

一个使用正则表达式进行网页中特定信息抽取的例子,并对所得出的信息进行整合,用TextRank得出整合信息的关键词,方便查阅和文本匹配

2015-01-15

简单的FTP服务程序

用Java写的简单的FTP服务的程序,其中使用jetty作为servlet容器,有一个简单的web界面进行管理,使用derby嵌入式关系型数据库作为上传状态的控制,用数据库进行同步的控制,做到安全和高可靠性,FTP服务支持邮件预警以及断点续传等功能

2015-01-15

Java虚拟机规范

Java SE 7虚拟机规范的中文翻译版本,大家可以参考学习

2014-10-17

red5官方参考文档

red5官方的参考文档,可以帮助大家快速地了解red5

2014-10-15

mapreducev1

the textmining algorithms implemented by mapreduce

2014-07-18

量子聚类Matlab工具箱

量子聚类算法的Matlab工具箱,大家可以下载使用

2012-11-18

ASP.NET实现的简单的三层架构

一个简单的三层架构的例子,只是给大家入门用,里面只有一个表,实现了基本的增删查功能,建表命令在压缩包中,直接建表就可以运行

2011-01-14

ADO.NET的使用(C#)

PDF格式的文件,详细地介绍了如何用ADO.NET连接数据库,希望能对大家有用

2010-06-20

SQL server语句的学习

压缩包中是关于SQL server语句的一些具体例子

2010-06-13

2009-2010计算机统考考研真题及答案

个人整理的2009和2010年计算机统考的真题和答案,其中的答案可能和标准答案有出入,请大家谅解。希望能够对考研的学生有所帮助

2010-06-13

java实现的学籍管理系统

用Access数据库采用JDBC-ODBC Bridge连接,由于时间有限,因此系统只具有一些基本的功能,如果哪位同学有需要可以联系我,我会完善这系统,希望这程序能对大家有帮助

2010-01-23

数据结构1800试题

数据结构的1800道试题,希望对考研和希望在数据结构中精进的学子有帮助

2010-01-13

数据结构查找和排序C代码实现

用C语言实现的代码,简单的查找和排序算法代码,自己写的,可能有点小错误,希望大家见谅

2010-01-13

C课程设计说明书(内附源代码)

这是自己以前做的课程设计,当时选的题目是学生选课课程系统,以在VC中运行通过,希望能对一些刚接触C语言的同学们有一点帮助,当然程序写得也不是很好,乐意大家在此基础上改进

2010-01-06

二叉树的递归遍历、非递归遍历和层次遍历

自己写得二叉树的遍历程序,包括递归遍历,栈的非递归遍历和队列的层次遍历,已在VC中运行通过,希望以此与大家交流交流,如有不妥之处希望大家能帮我修正,本着共同进步的目的。

2010-01-06

Applet编写的三角函数曲线

自己用applet编写的正弦曲线,程序是简单了点,但是希望对大家有点作用

2009-12-30

高教版电子商务课件第一章

很珍贵的资源 希望与更多的本科生分享 是很好的教学与自学资源

2009-12-29

数据结构链表的学生信息C代码实现

自己写的数据结构学生信息的链表实现,其中存在很多的不妥之处,希望与大家共同进步,也希望大家可以给我提出建议

2009-12-11

数据结构顺序表学生信息的实现

自己写的C代码,小弟不才,程序中有很多的不妥之处,希望可以与大家一起交流,共同进步

2009-12-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除