hadoop streaming multi-input 输入任意时间段
最近项目中需要一个时间段的数据作为输入到 Mapreduce 处理,比如时间段20190410 - 20190510 这样一个月的数据。以下是我的解决办法,可能有更好的方式,欢迎大家留言。首先回顾一下 hadoop streaming 的通配符:通配符名称匹配*星号匹配0或者多个字符?问号匹配单一字符[ab]字符类别匹配{a,b} 中的一个字符...
原创
2019-05-17 13:51:47 ·
561 阅读 ·
0 评论