kettle python脚本_Pentaho Kettle 8.2带来的新变化

Pentaho 8.2企业版带来了大量的功能和改进,从PDI中的新流媒体和Spark功能到大数据增强和云数据安全。 Pentaho 8.2还通过引入新功能和改进继续改善Pentaho平台体验。全新的Python ExecutorStepPython ExecutorStep将CPython脚本语言的强大脚本功能和算法整合到您的转换中。这个新的PDI步骤对于希望利用机器学习和深度学习方法,模型管...
摘要由CSDN通过智能技术生成

Pentaho 8.2企业版带来了大量的功能和改进,从PDI中的新流媒体和Spark功能到大数据增强和云数据安全。 Pentaho 8.2还通过引入新功能和改进继续改善Pentaho平台体验。

全新的Python Executor Step

Python Executor Step将CPython脚本语言的强大脚本功能和算法整合到您的转换中。这个新的PDI步骤对于希望利用机器学习和深度学习方法,模型管理策略以及与数据科学笔记本集成的数据科学家和数据工程师特别有用。

通过对Pandas dataFrames和NumPy数组的本机支持,Python Executor步骤可以从各种源读取数据,修改和从数据中获取值,然后将输出作为一组PDI字段提供。该步骤具有两种执行脚本的方法:从本地或托管位置运行脚本文件,或手动将脚本嵌入到步骤中。

从PDI访问HCP

您现在可以从PDI的虚拟文件系统(VFS)浏览器访问Hitachi Content Platform(HCP)分布式存储系统。在HCP中,访问控制列表(ACL)授予用户执行各种文件操作的权限。命名空间用于逻辑分组,访问和对象元数据(例如保留和碎化设置)。点击了解有关如何从PDI设置HCP访问权限的详细信息。

流数据改进

Pentaho Data Integration(简称PDI)具有适应自适应执行层(AEL)中的Spark引擎和访问高级消息队列协议(AMQP)流数据的新步骤。

增加PDI中的Spark功能:现在,Spark步骤已定制为使用本机Spark API。 Spark API旨在利用先进的Spark引擎,该引擎专为加快硬件资源的处理和分发而设计。在PDI中了解有关Spark on AEL的更多信息。

PDQ中的AMQP增强功能:高级消息队列协议(AMQP)为在Pentaho中生成或使用实时流数据提供了强大的连

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
可以使用Kettle的"Execute SQL script"步骤来执行SQL脚本。以下是一个使用Java代码调用Kettle执行SQL脚本的示例: ```java import org.pentaho.di.core.KettleEnvironment; import org.pentaho.di.core.database.DatabaseMeta; import org.pentaho.di.job.Job; import org.pentaho.di.job.JobMeta; import org.pentaho.di.trans.Trans; import org.pentaho.di.trans.TransMeta; public class KettleSqlScriptExecutor { public static void main(String[] args) throws Exception { // 初始化Kettle环境 KettleEnvironment.init(); // 创建数据库连接元数据 DatabaseMeta databaseMeta = new DatabaseMeta(); databaseMeta.setName("my_database"); databaseMeta.setDatabaseType("MySQL"); databaseMeta.setAccessType(DatabaseMeta.TYPE_ACCESS_NATIVE); databaseMeta.setDBName("my_db_name"); databaseMeta.setHostname("localhost"); databaseMeta.setUsername("my_username"); databaseMeta.setPassword("my_password"); // 创建转换元数据 TransMeta transMeta = new TransMeta(); transMeta.setName("My Transform"); transMeta.addDatabase(databaseMeta); // 添加"Execute SQL script"步骤 String sqlScriptPath = "/path/to/my/sql_script.sql"; String sqlScriptContent = new String(Files.readAllBytes(Paths.get(sqlScriptPath))); String stepName = "Execute SQL Script"; String databaseName = "my_database"; transMeta.addSQLScriptStep(sqlScriptContent, stepName, databaseName); // 创建转换并执行 Trans trans = new Trans(transMeta); trans.execute(null); trans.waitUntilFinished(); // 如果需要,可以获取转换的日志 String logText = trans.getLogText(); System.out.println(logText); } } ``` 上述代码中,我们创建了一个数据库连接元数据和一个转换元数据,然后添加了一个"Execute SQL script"步骤来执行SQL脚本。最后,我们创建了一个转换并执行它。如果需要,我们可以获取转换的日志。 需要注意的是,上述代码中的Kettle版本为8.3.0。如果使用其他版本的Kettle,可能需要做出相应的修改。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值