看了这么长时间的pentaho,我觉得有必要做一下总结:
首先,有关pentaho我重点接触到了其中如下三个子工具:
kettle:一个ETL工具(数据抽取,转换,加载),具体来说是对数据进行抽象提取,以达到我们想要展现的形式,当然也可以实现数据的迁移。它有两种脚本文件:job和transform
transform如下所示,即为一个简单的转换过程(获取日期->转换为YYYY-MM-DD的格式->在表中由该日期作为查询条件->将查询结果输出到文件中):
job中可包含一个转换, 负责完成整个工作流的控制。如下所示:
report designer:一个报表设计器,可以在pentaho其他地方调用它生成的prpt文件。我现在用pentaho studio可以调用无数据库连接的基本报表,若有数据库连接还要做一些配置(这点一直没研究出来)。
report designer可以根据数据生成图表进行分析。下图为部分报表内容: