ETL工具
hcq_lxq
这个作者很懒,什么都没留下…
展开
-
Kettle 运用中报错
1.修改kettle配置文件/home/hadoopap/data-integration/system/karaf/system/pentaho-karaf-features/pentaho-big-data-plugin-osgi/8.0.0.0-28/pentaho-big-data-plugin-osgi-8.0.0.0-28-features.xml。kettle JOB 假死,需要到系统上面杀死进程。报错信息: JOB一直处理执行状态。原创 2023-08-08 10:02:38 · 745 阅读 · 0 评论 -
dataX连接hive时报错(Required field ‘client_protocol‘ is unset)
安装datax之后,编写json测试ftp2hdfs的作业时,报如下错误: java.sql.SQLException: Could not establish connection to jdbc:hive2://xx.xx.xx.xx:10000/default: Required field 'client_protocol' is unset! Struct:TOpenSessionReq(client_protocol:null, configuration:{use:database=d原创 2022-01-13 20:01:30 · 2142 阅读 · 0 评论 -
unable to create new native threadjava.lang.OutOfMemoryError: unable to create new native thread
使用kettle批量在指定服务器上执行任务是包如下错误:java.lang.OutOfMemoryError: unable to create new native threadjava.lang.OutOfMemoryError: unable to create new native thread解决方法:root用户在如下/etc/security/limits.conf文件中插入下面两行:* - nofile 275828*原创 2021-12-30 14:18:33 · 1382 阅读 · 1 评论 -
CDH 中hive的 Hive Metastore Server中JVM 堆栈内存溢出问题分析
问题: 在操作BDR迁移hive数据的过程中。新集群的CM界面突然无法显示,最中后台找到对应BDR任务手动杀死进程,重启集群的server和agent服务。CM界面正常显示,但是过了一会HMS异常退出。CM界面CMS中JVM 堆栈内存显示高出设定值。重启CMS过一段时间还是会自动挂掉。JVM 堆栈内存显示仍然高出设定值。问题: 经过排查发现元数据库磁盘空间不足,发现hive元数据库notification_log表竟然几百G,数据库扩容后仍然没用。最后查到noti...原创 2021-12-09 20:55:03 · 2872 阅读 · 0 评论 -
Kettle并行执行Trans后的合并问题
https://blog.csdn.net/weixin_34327761/article/details/86361866转载 2021-09-03 16:23:11 · 236 阅读 · 0 评论 -
kettle中如何实现循环
kettle使用循环样例如下:实现循环首先需要控制循环次数,并对每次循环进行累加标记。读取文本:现在读取某个表的数据进行循环(也可以读取某个文件进行循环):SELECT 'aaa' as id from dualunion allSELECT 'bbb' as id from dualunion allSELECT 'ddd' as id from dual初始化参数(JS脚本):var prevRow=previous_result.getRows..原创 2021-09-03 13:52:22 · 9197 阅读 · 1 评论