前言
数据仓库将是中国未来几年IT行业的明星,其发展将是无法估量的,本文将从DB、ETL、前端展现工具方面对数据仓库的流行产品进行一些简单的探讨,以供大家参考。
数据库(DB)
后台数据库目前比较流行的包括TeraData(NCR)、IQ(Sybase)、ORACLE、DB2等,而就本人的理解,ORACLE和DB2在OLTP中占有绝对的优势,但在注重海量数据高效查询的OLAP中,远远不及TeraData和IQ,故本文仅对TeraData和IQ进行比较与讨论。
1. 查询效率
经过严格的测试,总体上来讲是IQ比较快,因为IQ所有的卖点就是“无处不索引”;但TeraData有一个主索引的概念,当按照主索引进行查询时,效率会比IQ高,但若不是按照主索引进行查询讲比较慢,没有IQ的效率高。
2. 兼容性
兼容性方面就没法说了,TeraData只认自己公司的产品,从软件到硬件,其他都使用不成,比如说备份用的磁带都必须是专用,而IQ可以使用在目前所有流行产品上(如IBM、SUN等等),不存在兼容性的问题。
3. 价格
对于数据仓库这种项目来讲,投资一般都比较大的,基本上都在千万级别,最小的也要好几百万,故而一般的公司都投资不起,就目前来看,在我国也就电信行业、银行、能源、铁路、民航等少数几家比较有实力的公司才能投资起,但随着这些公司投资的日渐成熟,都不会像以前哪样随便砸钱了,所以价格因素是一个很重要的方面。从投资上来看,当然是IQ便宜的多,TeraData的价格就相当贵了,比方就是一个备份磁带由于是专用而非常贵,其一个节点的价格就相当高,随便也要好几百万。
4. 扩展性
扩展性当然是TeraData比较好,而且效率随着硬件的扩展将得到提高;但IQ也不是说扩展性不好,只是说它的扩展没有TeraData那么方便快捷;但TeraData一个节点只能带4TGB的磁阵,当没有空间时只好扩节点而不是简单的增加磁阵。
5. 数据库管理台
不知Sybase公司是怎么回事,其对数据库管理台的开发相当差,没法和TeraData比了,当然就更没法和ORACLE比了。
6. 磁阵空间利用
IQ的压缩比是所有数据库中最好的一个,好几百兆的数据被压缩进入数据库后就只是占用一点而已;而TeraData是对空间最浪费的一个,这个可能与NCR公司销售策略有关吧,当空间使用完了,你只好买节点,哪可是大把的钱。
总之,就我使用此两个数据库的感受是IQ要在多个方面超越TeraData,如果给两种数据库打分的话,IQ应该在80分,而TeraData最多就60分。
ETL工具
ETL工具最好的应该是Informatica PowerCenter和IBM Data Stage两种,从目前本人使用的情况,其他厂商的产品距离这两种产品差距实在是不小。
1. 简易性
从使用的简易性方面看,这两种产品都很不错,如果实在要他们中选择一个更加优秀的,哪我就推举PowerCenter。
2. 效率
两个产品的效率都比较高,经测试发现Data Stage在处理DB2和Informix时要更快,可能是自己公司的产品吧。
3. 价格
一般来讲,ETL工具的价格都非常高,但是Informatica PowerCenter的价格更加高的离谱,是按照连接数据库的价格来购买,如连接ORACLE数据库是多少钱,DB2是多少钱。
4. 服务
两个产品的技术支持都不算太好,相对而言Data Stage要稍微好些,但PowerCenter使用的人相对要多点,可以在网上找到许多高人的指点。
综上,这两种产品都非常优秀,其他公司的产品在他们面前就好像幼儿园的小朋友,故选择他们中任何一种都是正确的。
前端展现工具
前端展现工具现在非常多,有国外的也有国产的产品,从目前市场的占有率及使用情况来分析,本文就讨论BO及COGNOS两种产品。
1. 语义层
对于语义层定义来讲,这是BO最擅长的地方,其他公司的产品很少有它那么全面的定义内容,据相关报告,说语义层定义是BO的专利,其他公司都是购买它的专利而已。
2. 报表制作
报表制作过程中BO最容易处理,像COGNOS若报表有问题需要修改,哪是相当麻烦的,而且处理一遍很慢(大数据量)。
3. 美观
这方面COGNOS的表现要远远大于BO,BO的界面是相当死板,而且二次开发也不是那么容易。
4. 效率
由于COGNOS采用了不同的存储机制,当进行大数据量报表查询时,要比BO的表现好些。
5. 价格
两种产品的价格都不菲,但BO更贵一点而已。
综上,BO及COGNOS都表现的非常优秀,但本人认为BO更好一点而已,虽然界面不美观。
结论
若要进行数据仓库的建设,在考虑投资、性价比、支持等方面考虑,本人的建议是,采用如下配置好像既能保护好投资,也能够很好使项目得到顺利实施,即IQ+PowerCenter+BO。尤其是要慎重使用NCR的产品,最直接的原因就是无法和其他公司的产品兼容,一旦使用将无法摆脱它的束缚,而且性价比也不高。
(转自:http://hi.baidu.com/sunning_cho/blog/item/f982a40652a8567c020881b4.html)