2012年04月_刘啸尘-勤奋的小小尘

12月 11月 10月 09月 08月 07月 06月 04月 03月

原创 mapreduce combine

最近使用Map-Reduce的时候，有几个小问题一直困扰着我，因为刚接触Map-Reduce也没多久，对Map-Reduce整个体系没有多少认识，所以仅仅通过实验来猜测结果，慢慢积累，或许以后能阅读Hadoop的源代码。问题如下：1、如果文件中的记录key为空，那么这些key为空的记录是否会被认为key相等呢？2、reduce结束条件是什么？3、Jo

2012-04-21 10:43:10 2317 1

原创 java list序列化

编图书馆的时候用了很多ArrayList,发现了反序列化后出现了如下问题：序列化前两个ArrayList中的某一元素指向同一对象，经过序列化再反序列化过程后，他们居然指向了不同对象，出现了不同步的问题，那是为什么呢？查看一下Java.util里面的ArrayList源代码，发现ArrayList 重写了writeObject方法和readObject方法:/**

2012-04-21 10:29:12 3908

原创 java序列化反序列化

首先解释两个概念,何为序列化?何为反序列化?序列化:将对象转化成流的过程称为序列化反序列化:将流转化成对象的过程称之为反序列化序列化与反序列化必须遵守的原则a) Java对象在java中要想使一个java对象可以实现序列化与反序列化,必须让该类实现java.io.Serializable接口java.io.Serializable接口定义如下:

2012-04-21 10:27:33 1306

java序列化反序列化

首先解释两个概念,何为序列化?何为反序列化?序列化:将对象转化成流的过程称为序列化反序列化:将流转化成对象的过程称之为反序列化序列化与反序列化必须遵守的原则a)Java对象在java中要想使一个java对象可以实现序列化与反序列化,必须让该类实现java.io.Serializable接口java.io.Serializable接口定义如下:publicin...

2012-04-21 10:27:00 61

原创 java取得URL顶级域名

String url = "http://anotherbug.blog.chinajavaworld.com/entry/4545/0/";Pattern p = Pattern.compile("(?Matcher matcher = p.matcher(url);matcher.find();System.out.println(matcher.group());

2012-04-21 10:24:34 6100 2

java取得URL顶级域名

String url = "http://anotherbug.blog.chinajavaworld.com/entry/4545/0/";Pattern p = Pattern.compile("(?<=http://|\\.)[^.]*?\\.(com|cn|net|org|biz|info|cc|tv)",Pattern.CASE_INSENSITIVE);Matcher m...

2012-04-21 10:24:00 85

转载 hadoop InputFormat解析

在执行一个Job的时候，Hadoop会将输入数据划分成N个Split，然后启动相应的N个Map程序来分别处理它们。数据如何划分？Split如何调度（如何决定处理Split的Map程序应该运行在哪台TaskTracker机器上）？划分后的数据又如何读取？这就是本文所要讨论的问题。先从一张经典的MapReduce工作流程图出发：1、运行mapred程序；2、本次运行将生成一

2012-04-13 17:41:17 795

转载用CombineFileInputFormat处理小文件的mapreduce程序

Dealing with lots of small files in Hadoop MapReduce with CombineFileInputFormatInput to Hadoop MapReduce process is abstracted by InputFormat. FileInputFormat is a default implementation th

2012-04-13 16:59:06 2513 2

用CombineFileInputFormat处理小文件的mapreduce程序

Dealing with lots of small files in Hadoop MapReduce with CombineFileInputFormatInput to Hadoop MapReduce process is abstracted by InputFormat. FileInputFormat is a default implementation ...

2012-04-13 16:59:00 60

转载集群运行mapreduce原理

1．什么是MapReduce? MapReduce 是由Google公司的Jeffrey Dean 和 Sanjay Ghemawat 开发的一个针对大规模群组中的海量数据处理的分布式编程模型。MapReduce实现了两个功能。Map把一个函数应用于集合中的所有成员，然后返回一个基于这个处理的结果集。而Reduce是把从两个或更多个Map中，通过多个线程，进程或者独立系统并行执

2012-04-11 15:59:28 1647 4

集群运行mapreduce原理

1．什么是MapReduce?MapReduce是由Google公司的Jeffrey Dean和Sanjay Ghemawat开发的一个针对大规模群组中的海量数据处理的分布式编程模型。MapReduce实现了两个功能。Map把一个函数应用于集合中的所有成员，然后返回一个基于这个处理的结果集。而Reduce是把从两个或更多个Map中，通过多个线程，进程或者独立系统并行执行处理的结...

2012-04-11 15:59:00 59

java指纹识别-图片识别技术

java指纹识别-图片识别技术。这是一个项目工程。里面有图片的测试。可以根据指纹图片进行比对。

2012-04-23

hive-cdh3-api.chm

hive-cdh3-api.chm hive 的api 开发必备

2012-04-19

Hadoop源代码分析

Hadoop源代码分析完整版，绝对珍藏级文档，会对你的学习有非常大的帮助

2012-04-12

spring源码解析

spring源码解析非常好的东西，全面，面面俱到，看了之后感觉不错，上传，欢迎下载

2012-04-11

第一步：输入任意用户名( myeclipse.10.0安装包内附下载地址) 第二步：点击Systemid... 按钮，自动生成本机器的systemid。第三步：点菜单Tools->RebuildKey 第四步：点击active按钮.会在显示区域生成 LICENSE_KEY ACTIVATION_CODE ACTIVATION_KEY 这时候不要打开myeclipse的激活页面输入。第五步：打开菜单Tools->ReplaceJarFile，弹出文件选择对话框，到myeclipse的安装目录common文件夹下选择plugins文件夹点击打开，程序会卡住，不要担心，正在替换文件呢！一会之后，会输出信息，文件已被替换第六步：点菜单Tools->SaveProperites OK 。打开你的myeclipse已经不需要再输入激活码什么的了。 =======如果注册成功，下面就不用看了====================== *点击Systemid... 按钮，自动生成本机器的systemid。可能会出现一行错误 Cannot find JNIWrapper native library (libjniwrap.so) in java.library.path:~~ 不需要理会，再点击一次即可出现systemid。破解不成功主要原因有两个 * 生产出来的systemid和exe破解出来的那个对应不上，这个问题我也研究了，没有问题，因为myeclipse里面只要找到能对上一组的数据，systemid就算对上了。如果某个操作系统systemid不对，打开myeclipse---myeclipse----Subscription Infomation--输入用户名激活码----activate now ---web active---- 会看到网址里面有参数 sytemId * publicKey.bytes 没有替换，请替换，程序中有这个功能（Tools->ReplaceJarFile ，参见上面说明）。

2012-03-25

Pig 编程实现使用某个符号分割

Pig 编程实现按某个符号分割，并AS 存储

2012-03-23

POI的jar文件

POI的jar文件，绝对可用，亲自实验过

2012-03-22

java读取文件内容写入xls文件

2012-03-22

hbase 开发实例

2012-03-21

HBase API帮助文档

HBASE AP

2012-03-21

java web 标签大全

2012-02-16

myeclipse序列号

2012-02-16

sping 2.5 文件

2013-03-27

SecureCRT7.0 官方下载及注册机和注册方法

激活步骤如下： 1）准备工作：安装好SecureCRT软件，下载并得到该注册机。 2）保持SecureCRT软件关闭（运行的话会提示你正在运行的，关闭就好）。 3）将注册机拷贝到你的CRT软件的安装的目录下； 4）点击【Patch】按钮，会让你选择文件，选择SecureCRT.exe可执行文件，还会再提示一次选择一个help什么文件。总之，确定后都会提示成功信息。 5）然后打开CRT软件，按照相应的提示输入注册机上显示的信息（当然重新生成也是可以的）。注意，默认打开CRT时候会是一个输入key的页面，什么都不输入，点击下一步，选择输入自己的相关信息。就会看到分别让你输入名称、序列号等相关日期了。完成结束。看看自己的是否有激活成功。有的可能会再第一次时候出现失败，重复1~2次会成功的。

2013-03-27

Fiddler 最好的网络抓包工具

Fiddler 最好网络抓包工具 http 没有之一

2013-03-13

guava使用方法教程

guava 使用方法教程

2013-03-08

hadoop 2.0.0 eclipse plugins 插件

2013-03-08

mondrian学习资料

很好的学习资料，里面有很实用的mdx语句

2013-02-01

jQuery1.8.3 API.chm 中文版

jQuery 1.8.3 --作者：hemin反馈/更新,还提供在线更新最新版链接

2013-02-01

多维数据查询MDX教程（全）

MDX 中的重要概念使用成员、元组和集 (MDX) MDX 语法元素标识符表达式使用多维数据集表达式和子多维数据集表达式使用维度表达式使用成员表达式使用元组表达式使用集表达式使用标量表达式使用空值运算符（MDX 语法）算术运算符位运算符比较运算符串联运算符集运算符一元运算符赋值运算符函数（MDX 语法）使用字符串函数使用数学函数使用逻辑函数使用成员函数使用元组函数使用集函数使用维度函数、层次结构函数和级别函数使用存储过程 (MDX) 注释（MDX 语法）保留关键字（MDX 语法） MDX 查询基础知识基本 MDX 查询 EXISTING 关键字用查询轴和切片器轴限定查询指定查询轴的内容指定切片器轴的内容在简单示例中使用查询轴和切片器轴在查询中建立多维数据集上下文在 MDX 中生成子多维数据集在 MDX 中生成命名集创建查询作用域的命名集创建会话作用域的命名集在 MDX 中生成计算成员在 MDX 中生成单元计算创建和使用属性值操作数据修改数据使用变量和参数 MDX 脚本编写基础知识基本 MDX 脚本管理作用域和上下文错误处理支持的 MDX MDX 语言参考 MDX 语法约定 MDX 语句参考 MDX 脚本编写语句 MDX 数据定义语句 MDX 数据操作语句 MDX 运算符参考 --（注释） -（排除） -（负） -（减） *（叉积） *（乘） /（除） ^（幂） /*...*/（注释） //（注释） :（范围） +（加） +（正） +（字符串串联） +（联合） <（小于） <=（小于或等于） <>（不等于） =（等于） >（大于） >=（大于或等于） AND IS NOT OR XOR MDX 函数参考 AddCalculatedMembers Aggregate AllMembers Ancestor Ancestors Ascendants Avg Axis BottomCount BottomPercent BottomSum CalculationCurrentPass CalculationPassValue Children ClosingPeriod CoalesceEmpty Correlation Count（维度） Count（层次结构级别） Count（集） Count（元组） Cousin Covariance CovarianceN Crossjoin Current CurrentMember CurrentOrdinal CustomData DataMember DefaultMember Descendants Dimension Dimensions Distinct DistinctCount DrilldownLevel DrilldownLevelBottom DrilldownLevelTop DrilldownMember DrilldownMemberBottom DrilldownMemberTop DrillupLevel DrillupMember Error Except Exists Extract Filter FirstChild FirstSibling Generate Head Hierarchize Hierarchy IIf Intersect IsAncestor IsEmpty IsGeneration IsLeaf IsSibling Item（成员） Item（元组） KPIGoal KPIStatus KPITrend KPIWeight KPICurrentTimeMember KPIValue Lag LastChild LastPeriods LastSibling Lead Leaves Level Levels LinkMember LinRegIntercept LinRegPoint LinRegR2 LinRegSlope LinRegVariance LookupCube Max MeasureGroupMeasures Median Members（集） Members（字符串） MemberToStr MemberValue Min Mtd Name NameToSet NextMember NonEmpty NonEmptyCrossjoin OpeningPeriod Order Ordinal ParallelPeriod Parent PeriodsToDate Predict PrevMember Properties Qtd Rank RollupChildren Root SetToArray SetToStr Siblings Stddev StddevP Stdev StdevP StripCalculatedMembers StrToMember StrToSet StrToTuple StrToValue Subset Sum Tail This ToggleDrillState TopCount TopPercent TopSum TupleToStr Union UniqueName UnknownMember Unorder UserName ValidMeasure Value Var Variance VarianceP VarP VisualTotals Wtd Ytd MDX 保留字

2013-01-30

TA关注的人

java多线程编程

java指纹识别-图片识别技术

JAVA对象的序列化与反序列化

hive-cdh3-api.chm

Hbase学习总结

Hadoop源代码分析

spring源码解析

jsp+javabean+mysql实现登陆及增删改查示例

系统分析师考试综合知识试题分类精解

hadoop中文API

java将一个文件夹中的文件写入到一个文件

myeclipse 10.0下载及破解步骤

myeclipse.10.0安装包+破解补丁

Pig 编程 实现使用某个符号分割

POI的jar文件

java读取文件内容写入xls文件

hbase 开发实例

HBase API帮助文档

java web 标签大全

myeclipse序列号

sping 2.5 文件

SecureCRT7.0 官方下载及注册机和注册方法

Fiddler 最好的网络抓包工具

guava使用方法教程

hadoop 2.0.0 eclipse plugins 插件

mondrian学习资料

jQuery1.8.3 API.chm 中文版

多维数据查询MDX教程（全）

kettle 集成到自己的应用中_实例

kettle使用手册及培训手册大全-教程

fence2.0完美破解

intellij idea配色方案下载

CDH3U4的eclipse插件(hadoop eclipse插件)

OCJP最新题库

ehcache实例

quartz api 中文版

Java虚拟机基础

hadoop-core

算法导论.pdf

用友笔试题

java用CXF实现webservice如何自定义soapheader？

Pig 编程实现使用某个符号分割