hadoop记录

最新推荐文章于 2023-03-28 10:11:24 发布

jeppen

最新推荐文章于 2023-03-28 10:11:24 发布

阅读量94

点赞数

分类专栏：记录

本文链接：https://blog.csdn.net/u012884015/article/details/95485725

版权

记录专栏收录该内容

21 篇文章 1 订阅

订阅专栏

一、所有变量先初始化
二、两次输出：1次再换key，一次在程序结束

-D stream.num.map.output.key.fields=2 \  # 设置前几列为key
-D num.key.fields.for.partition=1 \ #使用 ！key中！前几列划分partition，分桶
-D stream.map.output.field.separator=, \  设置map输出的字段分隔符
-D map.output.key.field.separator=, \ 设置key内的字段分隔符
-D mapred.text.key.comparator.options="-k1,1 -k2,2n" \  # 定义key的排序方式，第一列文本序，第二列数字序
-D stream.reduce.output.field.separator=, \  设置reduce输出的字段分隔符，注意注释reduce，依然会执行排序，排序输出按照reduce输出的字段分隔符，输出
-D stream.memory.limit=6000 \  设置mapreduce的任务内存

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

jeppen

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop记录

-D stream.num.map.output.key.fields=2 \ # 设置前几列为key-D num.key.fields.for.partition=1 \ #使用！key中！前几列划分partition，分桶-D stream.map.output.field.separator=, \-D mapred.text.key.comparator.options="-k1...
复制链接

扫一扫