从pentaho到jaspersoft

从pentaho到jaspersoft

因infobright之故,我认识了pentaho和jaspersoft,因为infobright提供与它们配套的虚拟机,人都是懒惰的,更何况我使用虚拟机已经到了痴迷的程度。于是我先上了pentaho的贼船,至今仍徘徊在jaspersoft这条不知道能不能驶到头的幽灵船上。

infobright网站上是这样描述它的这两个partner的:

pentaho:

Pentaho Corporation provides a full spectrum of commercial open source Business Intelligence (BI) capabilities including reporting, analysis, dashboards, data mining, data integration, and a BI platform that have made it the world’s most popular open source BI suite.

jaspersoft:

Jaspersoft’s open source business intelligence suite   is the world’s most widely used BI software, with more than 8 million total downloads worldwide and more than 10,000 commercial customers in 96 countries. The company’s Jaspersoft Business Intelligence Suite provides a web-based, open and modular approach that address the next generation business intelligence needs of the enterprise. Jaspersoft’s software is rapidly updated by a community of more than 90,000 registered members working on more than 350 projects, which represents the world’s largest business intelligence community.

大意是说pentaho是世界上最popular的开源BI(商务智能)套件,而Jaspersoft是世界上最widely used的BI软件。尽管我并不知道“最popular”跟“最widely used”到底有何区别,尽管我也知道自己的直觉往往是不准,但我还是根据自己的直觉选择了pentaho,作为我的第一个BI尝试。大概是觉得强调BI suite与BI platform的pentaho怎么说也得比强调software的jaspersoft更为强大,也有可能仅仅是因为infobright.org中download菜单上pentaho排得比jaspersoft靠前。但是我后来惨重的经历再次血淋淋地证明,庞大并不等于强大,事无巨细还不如专注做好细节。

于是我先下载了infobright+pentaho的虚拟机,解压,vmware启动就能用,还是以web方式提供的一个服务,立马就能体验,很有成就感。其实中间还是遇到了一些小麻烦,主要是网络与访问权限方面的,把vmware的Network Connection设置为Host-only,同时参考着压缩包里的README来做,基本没有太大问题。

瞎折腾一番后,觉得好玩,想深入还是重新下载代码自己重新搭建吧,于是跑到这个页面开始下载。不要眼花瞭乱,基于WEB的BI套件通常包括几部分:一个WEB服务、一个报表设计器、数据聚合与转换(ETL)。一定要下载的是服务平台:Business Intelligence Server,同时把Report Designer也下载下来作报表设计之用。其它的可以先不用管,这两个就够折腾的了。

经过一段时间的使用之后,颇感疲惫不堪,商务智能这玩意,面向企业用户,使用的技术门槛不高,但有一本详尽的使用手册或者接受软件提供方的培训教程非常重要,否则一个人摸索起来着实费劲。pentaho的报表设计软件Report Designer用起来BUG也很多,我不知道windows版本是否这样,但linux版本的实在是个考验人耐心的玩意儿。到最后实在没有心思再跟它折腾,更别提其它几个似乎功能更强大的data integration和metadata editor这些套件。

pentaho的web界面看起来更user friendly,用起来却完全不是那么回事,相对而言,jaspersoft的web界面则更工程师化,让人感觉有厚重感。jaspersoft所配带的官方文档也比pentaho要丰富得多,虽然两者的文档都是旧版本的文档,jaspersoft甚至还有一些中文文档。

jaspersoft套件列表在这里,必装的是jasperserver,里面内嵌了jasperReports和jasperAnalysis,前者是报表系统,后者是数据立方分析系统。iReport是报表制作的客户端软件,jasperETL是商务智能软件里必备的数据集成工具。有配套文档的是现在是3.5版本,安装包及文档可以这里下载。

参考着文档即可进行安装,可能会需要建立一些数据库,应该会比较顺利。安装后好后在安装目录启动服务,就可以通过web访问服务。有一些概念问题说明一下:

做一个jasper analysis,需要几个步骤:

  1. 需要建立一个data source,这相当于定义一个数据源,所有的操作将对这个数据源进行;
  2. 需要有一个data schema,这是一个xml格式的数据定义文件,对data source里需要用到的表及其表连接作相应的定义;
  3. 建立一个data connection,这是一个数据立方的查询连接,在这里选择合适的data source及data schema;
  4. 最后建立一个analysis view,在这里选择一个data connection,及定义一个MDX查询语句,MDX查询语句决定将会显示的数据立方是什么样子的。

需要注意的是,在定义data schema时,需要查询的表也要作维度化,分离出fact表和dimension表,详细内容可参看文档Mondrian-3.0-Technical-Guide.pdf,jaspersoft自带的几个样例也非常有参考价值。一个analysis view定义完成之后,就可以进行drilling, pivoting, filtering, visualizing等等操作,详情可参看文档JasperAnalysis-User-Guide.pdf。

jaspersoft的另一大功能是报表的制作,通常的做法是先用客户端软件iReport做出一个报表来,然后同步到服务器,即可在服务器进行实时查询,或者制订实时任务,让任务定时运行,定时发送报表到指定邮箱。这方面文档不多,得自己摸索的比较多,一些简单的指引可以从文档JasperServer-User-Guide.pdf中得到。一个报表可以包括数据源、控件、自定义参数、图表等等,如果有比较丰富的文档,再加一些耐心,可以做出很漂亮的报表来。因为不是设计人员,我更偏向于编码方面的实践,设计方面只求做出能用的报表即可,所以这方面并没有太多的深入。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值