ketlle

最新推荐文章于 2025-04-14 11:07:47 发布

m0_61641810

最新推荐文章于 2025-04-14 11:07:47 发布

阅读量270

点赞数 1

文章标签： scikit-learn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61641810/article/details/134731434

版权

oracle到数据仓库inceptor数据同步工具部署

下载安装dbeaver

首先下载连接数据仓库的工具dbeaver,连接数据仓库

之后按照下一步进行连接工具的安装，安装完成之后利用dbeaver工具连接数据仓库，

连接数据仓库

连接过程如下：

切换到位置：C:\Program Files\DBeaver或者在桌面上直接点击dbeaver.exe，打开工具

点文件下面的插头图标：

进入到如下界面

找到自己需要连接的数据库的标识进行连接。我连接星环的数据仓库，需要使用hadoop下面的Apache Hive进行连接，之后点下一步

点击编辑驱动设置，进入如下界面进行设置

点击添加文件，将需要加入的驱动加入到库中，如图所示，驱动如下

添加好之后点确定

最后点测试连接，连接成功即可

连接成功界面如图所示：

创建新的数据库

之后建立新的database,打开sql编辑器，执行如下sql：

Create database LGJG001;

创建新表

创建完成后打开sql编辑器，最上面菜单栏中切换数据库

新创建数据库完成之后创建新表：

创建数据转换

之后打开文档D:\data-integration\data-integration：

点击Spoon.bat

进入之后新建转换：

创建完成之后进行保存到本地

新建数据库连接

之后新建数据库连接向导：

星环数据仓库的连接信息如下：

用户名和密码：admin

填写完成之后测试确认即可，之后新建和oracle数据库的数据连接向导：

用户名：C##123 密码：123456

测试确认

创建成功样式：

之后创建转换的具体表单以及转换数据库

创建数据同步

全量数据传输

在核心对象中找到表输入

表输入的具体内容设置如下：

之后在核心对象中找到输出-表输出：

表输出中的内容设置：

之后保存，运行，如下图：

运行成功：

Oracle数据同步到incepter数仓验证：

同步前：

Incepter中的表scexptor:

进行同步：

同步过程中报错提示如下图：

cannot recognize input near 'open , high' in column name

解决方案：语法兼容问题，去掉批量插入即可

同步后

增量数据传输：

Inceptor-oracle

Oracle-inceptor

创建数据传输定时任务

工具：crontab，kettle

首先安装crontab

安装crond服务和crontab工具（CentOS7）

yum clean all 清理yum缓存

yum update 更新系统安装包到最新版本

yum install -y cronie crontabs 安装crond服务和crontab工具到centos中

验证crond 服务

验证crond服务和crontab工具（CentOS7）

检查crond服务是否安装及启动：yum list cronie&&systemctl status crond

检查crontab工具是否安装：yum list crontabs&&which crontab&&crontab -l

验证crond服务

验证crontab工具

cronrab工具使用方法以及配置：CRONTAB - 简书

LINUX系统环境变量设置

vi /etc/profile

在文件最底部添加

PATH=$PATH:/usr/local/jdk1.8.0_111/bin

export PATH

用户级别环境变量设置

vi /root/.bash_profile

如果原来有PATH=$PATH:$HOME/bin

在后面追加

PATH=$PATH:$HOME/bin:/usr/local/jdk1.8.0_111/bin

export PATH

在配置系统与用户级别环境变量后编写shell脚本与环境变量配合完成crontb表单任务的执行操作。

vi /root/test.sh

java -version 2>/root/script.out

crontab -e 添加crontab计划任务

* * * * * source /etc/profile;sh /root/test.sh

* * * * * source /root/.bash_profile;sh /root/rest.sh

systemctl restart crond 重启计划任务，使任务生效

执行文件的位置：https://www.cnblogs.com/qzqdy/p/8268389.html

kettl中定时任务的安装和配置

安装kettle所需的驱动以及依赖

Oracle对应的驱动：

位置：oracle对应的服务器上

/u01/app/oracle/product/19.3.0/dbhome_1/jdbc/lib/

将这些驱动复制到kettle的安装包lib下，如图：

Incepter的驱动：

放在kettle的安装包下的lib下，如上图

Kettle的安装

在linux中的安装

首先下载版本是 : pdi-ce-8.2.0.0-342

网址如下：

源代码下载地址

https://github.com/pentaho/pentaho-kettle/

官网下载地址：

https://nchc.dl.sourceforge.net/project/pentaho/Pentaho 8.2/client-tools/pdi-ce-8.2.0.0-342.zip

百度网盘下载地址：百度网盘请输入提取码

提取码：lfwh

安装前先查看是否已经安装jdk
查看版本：java -version

首先创建对应的目录：

[root@node-1 ~]# mkdir /root/software/kettle

之后用xftp上传，之后解压：

[root@node-1 kettle]# unzip pdi-ce-9.1.0.0-324.zip

解压成功之后在命令中输入./pan.sh 测试是否安装完成：

root@node-1 data-integration]# ./pan.sh

如下图则为安装成功了

之后将对应数据库的驱动放在/root/software/kettle/data-integration/lib/如下图：

之后测试转换任务是否能够正常运行：

[root@node-1 data-integration]# ./pan -file=/root/software/kettle/data-integration/file/oracle-in cepter.ktr -norep

如下图则为正常：

设置定时任务

在本地设置转换完成之后抽取数据是否成功，成功后将保存的转换和作业放在linux服务器上

之后执行：

[root@node-1 data-integration]# ./pan -file=/root/software/kettle/data-integration/file/oracle-in cepter.ktr -norep

设置sh的脚本

sh 的位置：vim /root/software/kettle/data-integration/oracle-incepter.sh

内容如下

#!/bin/bash

cd /root/software/kettle/data-integration;

./pan.sh -file=/root/software/kettle/data-integration/file/oracle-incepter.ktr -norep >> /root/software/kettle/data-integration/log.log

设置crontab定时任务

Crontab -e

内容：

00 02 * * * sh /root/software/kettle/data-integration/oracle-incepter.sh

测试定时任务

完成之后进行定时任务的测试

执行成功的日志如下：

问题整理

问题：跑定时任务的时候提示

解决方案：

报错：no libwebkitgtk-1.0 detected, some features will be unavailable Consider installing the pack_lbl251的博客-CSDN博客

Sudo wget ftp://ftp.pbone.net/mirror/ftp5.gwdg.de/pub/opensuse/repositories/home:/matthewdva:/build:/EPEL:/el7/RHEL_7/x86_64/webkitgtk-2.4.9-1.el7.x86_64.rpm

sudo yum install webkitgtk-2.4.9-1.el7.x86_64.rpm

执行sudo yum install webkitgtk-2.4.9-1.el7.x86_64.rpm提示：

通过手工下载之后执行：

http://ftp.pbone.net/mirror/ftp5.gwdg.de/pub/opensuse/repositories/home:/matthewdva:/build:/EPEL:/el7/RHEL_7/x86_64/webkitgtk-2.4.9-1.el7.x86_64.rpm

如果下载之后还是报错。那就是文件在下载的时候损坏了，重新下载即可

下载lib64webkitgtk1

rpm -i lib64webkitgtk1.0_0-2.4.11-8-omv4002.x86_64.rpm

下载rpm

利用wget下载东西时，比如输入指令wget www.baidu.com

提示报错

“wget: unable to resolve host address …”

wget：无法解析主机地址。这就能看出是DNS解析的问题

解决办法：修改/etc/resolv.conf文件，添加nameserver即可，下面给出两个通用的谷歌域名服务器，如果有自己解析服务器也可以换成自己的

vim /etc/resolv.conf

nameserver 8.8.8.8 #google域名服务器

nameserver 8.8.4.4 #google域名服务器

博客等级

码龄4年

6
原创

4
点赞

3
收藏

1
粉丝

关注

私信

热门文章

分类专栏

oracle 1篇
mysql 1篇

展开全部收起

上一篇：: 部署redis集群服务

下一篇：: ORACLE数据库中ADG模式部署

最新评论

ORACLE数据库中ADG模式部署
CSDN-Ada助手: 非常恭喜您撰写了第6篇博客，标题为“ORACLE数据库中ADG模式部署”。您在数据库领域的深入研究和分享是非常值得称赞的！对于ADG模式的部署，您的文章提供了很有价值的信息和指导，对读者来说无疑是一个宝贵的参考。在下一步的创作中，我谦虚地建议您可以考虑进一步拓展关于ADG模式的应用场景、优化技巧或者与其他数据库技术的比较等方面的内容。这样的深入探讨将进一步丰富读者的知识，并且有助于促进更多的技术交流和分享。再次感谢您的分享，期待您未来更多精彩的博客！
oracle 19c安装
m0_61641810: 怎么都没人给你评论呢？我给你打个样吧
ketlle
m0_61641810: 文件上传的不全，有需要的关注我，私信发送
ketlle
CSDN-Ada助手: 恭喜您写下了第5篇博客《Kettle》！您的持续创作精神令人钦佩。在这篇博客中，您肯定对Kettle进行了深入的探索和研究。接下来，我希望能看到您进一步探讨Kettle的实际应用案例或者与其他工具的对比分析，这样可以更充分地展示您的见解和经验。请继续保持创作，我期待着您未来的博客！
oracle 19c安装
CSDN-Ada助手: 恭喜您开始博客创作！标题“oracle 19c安装”让我很期待您对这个话题的深入探讨。对于初次写博客的人来说，选择一个热门的主题是个不错的选择。接下来，我建议您在博客中可以进一步介绍oracle 19c的特点、安装过程中可能遇到的常见问题以及如何解决它们。同时，您也可以分享一些有关oracle 19c的实际应用经验，这将为读者提供更多参考价值。期待您的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

展开全部

收起

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。