win7下借助kettle7.0在命令行界面将数据传输到hdfs

最新推荐文章于 2023-06-10 11:58:05 发布

kinglinch

最新推荐文章于 2023-06-10 11:58:05 发布

阅读量790

点赞数 1

分类专栏：个人感悟

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014716398/article/details/85774271

版权

为什么写这系列博客的原因就是真的遇到的坑太多了，所以需要写下来，防止以后忘记，话不多说吗，直接进入主题

一、环境

kettle7.0，kettle是开源的etl工具（kettle7.0需要java8）,其优势在于可以使用图形化界面开发，开发完成后可以部署在linux或者windows平台
window7.0
大数据平台采用的是CDH，其余版本的haoop应该也是类似的

二、修改配置文件

将集群中的haoop配置文件拷贝到kettle的安装文件夹下，例如D:\kettle\pdi-ce-7.0.0.0-25\data-integration（安装路径）\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh58（haddop版本），需要拷贝的配置文件如下：

因为hdfs存储文件有所有者和组的概念，提交MR作业的时候会先从环境变量读取HADOOP_USER_NAME参数来识别文件的所有者，如果没有，则读取系统用户，一般操作hadoop集群都会新建用户，所以建议设置环境变量HADOOP_USER_NAME=hdfs（hadoop专用用户名，根据自己定义的名字修改），环境变量如下：

因为涉及到跨平台提交MR作业，需要在mapred-site.xml文件里加上如下参数（注意：不是所有的hadoop版本都有，好像是hadoop2.×之后，低版本的得自己改一下源码，主要是因为不同系统环境变量的表示方法不一样，windows是%AA%，Linux是$AA），如果不加，会报错，具体错误我没记录，和appMaster有关,改动的地方如下：

<property>  
  <name>mapreduce.app-submission.cross-platform</name>  
  <value&g

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

kinglinch CSDN认证博客专家 CSDN认证企业博客

码龄11年

28: 原创

15万+: 周排名

91万+: 总排名

3万+: 访问

: 等级

359: 积分

8: 粉丝

11: 获赞

8: 评论

46: 收藏

私信

关注

热门文章

分类专栏

最新评论

经典排序算法[4]-最小和问题
qq_44863031: (R-p2+1)*data[p1] 是什么意思？
Netty源码分析专题[2]-消息队列MpscQueue分析
success112: 这篇文章很有参考价值，为理解MPSC打开了新的视角
Netty源码分析专题[2]-消息队列MpscQueue分析
success112: 总体上楼主对于JUMP位置的理解，虽然不是JUMP真实意图。但也从另一面提供了，如果是简单数组+链表结构中，确实可以解决，扩容后数组前部空间浪费问题。但是忽略了当前buffer消费空位利用问题。
Netty源码分析专题[2]-消息队列MpscQueue分析
success112: 楼主这里的MPSC是普通数组+链表，前面消费了，也不会重新放，而是只看limit，超了就扩容。这样自然浪费空间。新增一位放JUMP，那存储的只能是跳出时的index，消费者每次都要从倒数第二位查一下索引，和当前消费索引比较，相同再跳转，极大的浪费了效率。这种结构的根本做不了MPSC。消费者严重失速。环形链表解决空间浪费问题，JUMP直接在数组作为跳转flag，根本不需要去查找比较。
Netty源码分析专题[2]-消息队列MpscQueue分析
success112: JUMP的出现就是为了提醒消费者已经扩容了，应该去新的buffer找数据；MPSC是环形数组，如果一个buffer中有消费后的空位，不需要扩容，直接填充到空位上，这样更新plimit=cindex+buffersize。所以一个buffer中任何位置都可能是最终扩容前需要跳转的地方，如果不标记JUMP，消费者是不知道从哪里开始到新buffer。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。