关于BI引擎

最新推荐文章于 2024-03-20 15:50:55 发布

HashCodeWithJava

最新推荐文章于 2024-03-20 15:50:55 发布

阅读量5.5k

点赞数 1

分类专栏：数据库与知识工程文章标签： bi 数据挖掘数据分析引擎数据仓库平台

本文链接：https://blog.csdn.net/tangl_99/article/details/3827709

版权

本文介绍了开源BI引擎Pentaho在数据分析和数据挖掘领域的应用，对比了其与OpenMiner和Weka的区别，并指出Pentaho的全面性和高效性。作者预测随着大数据的普及，BI平台将成为企业不可或缺的系统，并强调了C/C++在大规模数据处理中的效率优势，期待出现基于C/C++的BI引擎。

摘要由CSDN通过智能技术生成

最近一直在搞实验室和华西出生缺陷中心合作的项目。本来当初我们计划直接在我们当初开发的OpenMiner基础上改进。但是后来在一次开会上，师兄介绍了开源的BI引擎Pentaho(http://www.pentaho.com/) 之后，发现Pentaho正是我们当初开发OpenMiner的时候想做的一切。记得还是本科毕业设计的时候，我们也帮学校教务处的运行科做一套数据分析的系统。虽然那个时候Weka已经是一个成熟的开源数据挖掘软件，但是Weka始终只是提供了一个软件包，更多的是一个算法包。它还没有成为一个和后台数据库，前台Web联系在一起的Data Analysis & Mining Engine。而OpenMiner的想法，则是提供一套开源的数据分析引擎的框架。但是现在，不得不说，Pentaho已经做了OpenMiner想做的一切，而且做得更好，更全面。Pentaho的诞生比较晚，也就最近1-2年才开始走向开发者的，甚至到现在，其中一些模块都还在开发中。不过 Pentaho的开发者似乎已经很想把该软件商业化，成为一个可以赚钱的商业软件。