Pentaho技术可行性分析

转载 2016年06月01日 14:58:44

Pentaho技术可行性分析

1.多种方案比较

 

BIEE

ODI

BIRT

Pentaho

公司

ORACLE

ORACLE收购ODI

Eclipse插件

Pentaho

价格

按License算,昂贵

按CPU算,贵

开源免费

社区版开源免费

性能

性能高

性能比传统ETL高10倍,最快的转换速度

性能一般,有内存溢出bug,不适用大数据量处理

性能一般,但可部署多服务器并发任务,支持集群

功能

完整的BI套件包括:ETL、Report &Analyst、Business Process

只包含ETL功能,支持计划任务。

Report designer、自带runtime服务、简单的数据转换

BI套件包括:ETL工具Kettle、BI Server、Report Design Studio、OLAP等

易操作性

安装复杂,操作需要专业培训。

图形设计界面,参数配置,易上手。

基于eclipse免安装,解压运行。图形界面报表开发,易上手。

免安装,解压运行。ETL工具Kettle是图形拖拽操作界面,易上手。

文档/社区支持

文档较多,社区一般,相关专业培训较多。

文档较多,社区不多

文档较多,商用较少,无任何技术支持。

官方社区比较活跃(英文)

中文社区有2个(不太活跃)

文档较少,多为英文文档。

扩展性

完整的BI方案,基本能满足企业的所有BI需求。

只是ETL工具,不包含报表展现功能

提供Java API,可嵌入web系统

综合的BI套件工具,支持更高数据分析功能的要求,但社区版功能有限。

移植性

支持多操作系统

支持多操作系统

支持多操作系统

支持多操作系统

监控

监控功能强大

监控功能一般

没有监控功能。

监控功能一般。

2.Pentaho介绍

2.1资源地址

    所有套件下载:http://sourceforge.net/projects/pentaho/

    Pentaho官方网站:http://www.pentaho.com/

    Pentaho爱好者中文论坛:http://www.itisbi.com/

Pentaho中文论坛:http://www.pentahochina.com/biforum/index.jsp

 

2.2概要介绍

    Pentaho BI套件的组成:

 

此处只介绍我们常用的几个:

 

2.2.1 Kettle ETL解决方案:

Data Integration,适用于各种场景的ETL工作。其又包括几个部分:

u     Spoon—设计转换及作业的集成开发环境

转换(Transformation,专注于数据加工):数据加工规则(源数据和目标数据的转换)。

作业(Job,专注于流程控制):多转换及其他操作的流转控制。

u     Carte—Job的执行引擎

    内置tomcat,定时执行和监控job的服务端。

²       支持增量抽取,通过时间戳或增量表进行抽取;

²       支持多数据源,excel及各种数据库

²       图形拖拽,支持JavaScript对数据进行复杂加工;

²       数据库管理转换文件,方便测试环境和生成环境切换(修改数据库配置)。

  

2.2.2 BI Server报表展现服务器

u     BI Server(基于Tomcat)

报表门户,内置tomcat,用户登陆后可访问具有权限的报表;

可用admin用户对报表进行用户授权。

u     BI Server Console(BI Server管理器)

管理前端角色、用户密码等

2.2.3 Report Design Studio(报表设计器)

u     通过studio制作报表,publish到BI Server

2.2.4 Dashboard(仪表盘)社区版未提供

2.2.5 Weka(数据挖掘解决方案)未试用

2.2.6 Mordrian OLAP(多维数据分析器)未试用

2.2.7 Pentaho Metadata Editor(元数据编辑)屏蔽底层业务数据 未试用

 

2.3 Pentaho拓扑简示

 

 

 

 

2.4企业版与社区版的区别

Pentaho企业版和社区版的区别主要表现在Dashboard(仪表盘)上。

Pentaho企业版的收费标准主要是是按用户数,基本价格都在3万美元左右。

Pentaho企业版相对社区版增加了门户功能,页面布局等功能。

Pentaho企业版的 ETL工具可以支持Hadoop,可视化建模等功能。

 

  

3.国内服务商

3.1人大金仓信息技术股份有限公司

其具有基于 Pentaho社区版开发的 BI平台版本,提供 Pentaho企业版的相应功能,而且提供本地化的服务。 

 

服务内容

价格

备注

培训(kettle,pentaho平台系列

工具的使用,部署pentaho平台)

3000/每学员/每天

 

三个学员以上+北京以外的往返交通费(飞机),

一般培训时间是两天。

外派开发(Onside Development)

3 W人/月

外派开发人员到客户方开发。

(三个人月以上) 

技术支持,二次定制开发

2500人/日

用户提出需求,我方根据需求在Pentaho平台上二次开发。

用户现场实施

2000人/日

完全基于 Pentaho产品的实施。

 

3.2苏州百咨信息技术有限公司

其在银行业商业智能方面的经验harland financial solutions (3.5 years),Wells Fargo Bank (1.5 years)等。其有很多银行方面的实施经验和案例,包括了 transaction analysis, loan analysis, delinquency analysis,investment analysis等

   1.培训Pentaho(5000元/天,除差旅费,3天),对企业人数不限。

2.设计方案:项目的前期设计,包括:数据仓库及数据模型的建立,ETL转换和olap的设计,价格具体要按实际的业务需求可以定。

3.项目外包。

Kettle调度和监控

Kettle调度和监控的理论知识介绍,具体类容如下: 1 调度     在这个指导文档中,主介绍两种类型Kettle任务和转换的调度方式。 Ø  操作系统级别的调度器:对于ETL来说,调度不是独一...

kettle调度监控最佳实践

Kettle作为用户规模最多的开源ETL工具,强大简洁的功能深受广大ETL从业者的欢迎。但kettle本身的调度监控功能却非常弱。     连Pentaho官方都建议采用crontab(Unix平台...
  • humsuen
  • humsuen
  • 2017年10月30日 11:32
  • 158

使用pentaho report 开发web报表

java开源报表软件中,pentaho report算是比较优秀的;能够满足大多数应用,足以和国内商业报表媲美;现记录实际开发报表完整过程教程,让初学者快速入门并应用到项目中。...

Pentaho CDE 源码构建

本文适合开发新手和对Eclipse、ANT、IVY不是很了解的开发人员,如果你对Eclipse相关开发非常了解也许以下方法对你来说都是小菜      很多好奇心强的朋友想在自己的环境下构建Pentah...

saiku 3.8 二次开发代码整理步骤(20160727更新)

saiku的社区版本二次开发一直以来都是比较费劲的,最近saiku社区版在新版本中,引入了license的机制,于是我选了个3.8稳定版本,且不需要license的版本作为基础,将代码合并在一个项目中...

ETL之kettle进行二次开发简单demo

kettle 代码开发,kettle 二次开发

四大主流开源BI商业智能平台对比评测

概述:本文对主流的四款开源BI商业智能平台进行了对比,主要从三方面入手,文档、演示和架构体系。 一、文档篇 完善的文档对平台的学习和使用是非常有用的,也是判断平台是否优秀的一个最直...

Pentaho学习笔记

一、       Pentaho 整体架构   cc       二、       Client tools 1.        Report Designer 报表创建工具。如果想创...

数据仓库的元数据管理

影响分析能力,血统分析可快速追溯数据来源和加工过程; 影响分析可掌握元数据之间的相互影响; 活力分析快速掌握数据实体之间的关系程度。...

数据仓库搭建全过程解析--通俗易懂

经过多年来企业信息化建设,大部分都拥有了自己的财务,OA,CRM 等软件。这些系统都有自己的独立数据库,记录着企业运行情况某个方面的数据。但是单独看这些系统的报表,并不一定能对企业运行情况有全面客观的...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Pentaho技术可行性分析
举报原因:
原因补充:

(最多只允许输入30个字)