Hadoop的分布式缓存

最新推荐文章于 2022-11-21 12:57:14 发布

吃鱼的羊

最新推荐文章于 2022-11-21 12:57:14 发布

阅读量324

点赞数

分类专栏： Hadoop SPARK

原文链接：https://www.cnblogs.com/twodoge/p/9762104.html

版权

Hadoop 同时被 2 个专栏收录

74 篇文章 1 订阅

订阅专栏

SPARK

59 篇文章 6 订阅

订阅专栏

https://www.cnblogs.com/twodoge/p/9762104.html

Hadoop的分布式缓存

1.什么时Hadoop的分布式缓存

答：在执行MapReduce时，可能Mapper之间需要共享一些信息，如果信息量不大，可以将其从HDFS中加载到内存中，这就是Hadoop分布式缓存机制。

2.如何使用缓存机制

答：在main方法中加载共享文件的HDFS路径，路径可以是目录也可以是文件。可以在路径末尾阶段追加 '#' +别名，在map阶段可以使用该别名。

这时执行第一步的代码：

String cache = "hdfs://10.105.xx.xxxx:8020/cache/file";  //目录或者文件
cache += "#myfile";  //file是文件的别名
job.addCacheFile(new Path(cache).toUri(), conf);  //添加到job设置

第二步，在Mapper类或者Reducec的setup方法中，用输入流获取分布式缓存文件。

protected void setup(Context context) throws IOException,InterruptedEXception {
          FileReader reader = new FileReader("myfile");
          BuffereReader br = new BufferedReader(reader);
}

如果你有问题，欢迎给我留言。如果这篇博客对你有帮助，请给我一个赞👍 Life is fantastic..

吃鱼的羊

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop的分布式缓存

https://www.cnblogs.com/twodoge/p/9762104.htmlHadoop的分布式缓存1.什么时Hadoop的分布式缓存答：在执行MapReduce时，可能Mapper之间需要共享一些信息，如果信息量不大，可以将其从HDFS中加载到内存中，这就是Hadoop分布式缓存机制。2.如何使用缓存机制答：在main方法中加载共享文件的HDFS路径，路径可以是目录也可以是文件。可以在路径末尾阶段追加 '#' +别名，在map阶段可以使用该别名。这...
复制链接

扫一扫