Hadoop
linluyisb
管理个人博客太麻烦, 回来csdn写点东西
展开
-
Hadoop学习之莎士比亚文档词频统计
一:前一段时间学习了Hadoop,快要找工作了。虽然学习的不深,还是稍微回顾一下,做点准备。多看看代码,及过程吧。 题目:就是统计每个单词出现的频率,很简单的。 二:简要过程 1)编写map类 class TokenizerMapper extends Mapper { //这些均是封装的数据类型,可视为int,long,String private f原创 2013-08-21 15:31:37 · 1850 阅读 · 0 评论 -
Hadoop学习之莎士比亚文档倒排索引
一:题目 莎士比亚文档倒排索引 二:简单的实现 1)map类 这其中定义一下map类的输出格式 public static class InvertedMapper extends Mapper{ //默认的这里不是longWritable的key么,怎么回事,应该要设置把 @Override protected void map(Long原创 2013-08-21 16:01:16 · 1618 阅读 · 0 评论