HANA vs PureData vs Exadata

转载:

http://storage.ctocio.com.cn/144/12445144.shtml

http://www.dbform.com/html/2012/2051.html
 

IBM Puredata Systems

  在日前的新加坡圣淘沙IBM InterConnect 2012上,IBM宣布推出名为PureData的针对大数据处理业务的集成系统PureData,三款针对不同细分领域的产品,分别是PureData Systems for Transaction、PureData Systems for Analytics和PureData Systems for Opertional Analytics。

1

  按照IBM官方透露的信息,PureData Systems设计用来帮助企业更加高效地管理、分析海量数据,并从中获取业务洞察。从这些信息,我们可以断定,它们将是Oracle Exadata、SAP HANA等高性能一体机设备直接竞争者。

  此前,SAP已有HANA Appliance,即在经过认证的合作伙伴硬件上预先安装配置好相应的数据库、云应用软件等的软硬件一体机。而Oracle(甲骨文)公司一直在宣扬其Exadata物有所值,不过,IBM认为其产品和Oracle Exadata有很大的差别。

  “Oracle在广告中称Exadata能应对所有的数据工作负载,这在他们看来是理所应当的事,因为如果你只有一个锤子,你肯定看所有的东西都像钉子。但在真正的生产环境中,其实交易、深度分析和操作分析的工作负载是有很大差别的。不是一个系统就能够全部应对的。”IBM PureSystems市场营销主管Pete McCaffrey说。

  IBM对Oracle的评价与SAP有些类似。SAP的数据库技术高级副总裁史蒂夫·卢卡斯(Steve Lucas) 评价表示,“一家公司的脖子上挂着100亿美元的数据库‘枷锁’,还挂着数十亿美元的硬件‘枷锁’,所以他们的解决方案就只能是把更多的硬件扔向依旧还是那么陈旧的软件。觉得公司需要的只不过是一种速度更快的数据库,那是一种目光短浅的观点。”

  在卢卡斯看来,Hana是一种与众不同的数据库,不仅能象一般的数据库那样保留记录(比如说一条牛仔裤出售的记录),而且还能进行分析工作(比如说去年牛仔裤的销售量是多少),预见性的分析(比如说明年将有多少条牛仔裤被售出),以及社交媒体情绪(人们对牛仔裤有何感觉)等。

 

Oracle Exadata

  Exadata是甲骨文于2008年首次推出,搭载Oracle Database的硬件产品。由于采用为数据库软件优化的服务器及储存硬件,Exadata号称比传统运行于开放服务器如IBM及HP平台上的系统性能更高。第一代推出时,Exadata是采用HP硬件,2010年推出第二代时因甲骨文已收购SUN,就改用SUN Sparc服务器。Exadata被视为甲骨文提供完整企业系统(stack)的重要里程碑。

  近日推出的第三代Exadata X3最大特色在于数据库软件本身升级为In-Memory数据库。Exadata X3号称闪存容量为前代产品的4倍;响应时间提升40%,数据扫描速度100 GB/秒。由于采用层次结构内存(memory hierarchy),系统能自动将经常使用的数据转移至闪存和随机存取内存,同时将较不常使用的数据保留在低成本的磁盘上,节省存储成本。同时,结合更新Exadata Smart Flash Cache,Exadata数据库写入量增加高达20倍。

  In-Memory数据库是将数据加载内存来运算,相较于传统加载磁盘来运算的技术速度更快。SAP的HANA Database是IT大厂推出的第一个In-Memory数据库,容量高达100TB。不过甲骨文强调,配合该公司的混合列式压缩功能,X3数据库将可在闪存内运算高达“数百TB”的数据。

  Exdata X3包含二种型号,分别为Exadata X3-2及X3-8,两款机器都可在闪存RAM内存中储存高达数百TB压缩数据。甲骨文指出,两者和前几代Exadata完全兼容,现有系统也可运用Exadata X3-2服务器升级。

  甲骨文表示,Exadata X3-2提供全机架、1/2机架、1/4机架和新款低成本的1/8机架配置,满足广泛的应用需求,X3-8采用全机架配置。两种X3系统均提供多机架的配置

 

  Oracle主席拉里·埃里森在Open World上说,:“SAP拥有一种内存数据库,这种数据库比我们所提供的产品略微小一些。”Open World上Oracle发布了其新一代的Exadata X3内存数据库一体机,X3内存数据库机每机架可支持22TB闪存,每机架4TB内存。也就是说,一个Exadata X3 系统能容纳最多26TB的数据。

 SAP卢东明(http://blog.sina.com.cn/monarchboy)说: Oracle Exadata X3 Database In-Memory Machine:“26TB all in memory and Flash”当然是一个很好的事情。但是,Larry,你错了!EX3只有4TB真正在DRAM里面,22TB是放在Flash Memory里面的。当然,Flash Card比Flash Disk/SSD快,但是仍然无法和DRAM相比。说EX3是"In Memory Machine",至少有误导客户之嫌。相比之下,HANA的架构中也有Flash Memory作为存储的一部分,但是我们从来不会把DRAM的容量和Flash Memory的容量加起来做为总容量来忽悠客户。512GB Unit的HANA含有1TB的DRAM, 至少1TB的FusionIO ioDrive, 至少2TB的硬盘,看看谁更实在!

当然,Oracle和SAP双方的口水战更加精彩,在此不加赘述,有兴趣的读者可以参考IT专家网的其他文章。

  值得注意的是,尽管对Oracle Exadata大加评议,但对另外的对手SAP HANA,IBM方面并未发表意见。这是因为,Oracle与SAP产品线的竞争更加直接,并且HANA和Exadata都属于内存计算产品范畴,而IBM PureData Systems并不强调这一点。另一方面,Exadata以其Oracle数据库为基础,而IBM “PureData System for Transactions从本质上来讲算是DB2数据库的延伸,但是它是在一个预集成的大数据平台,用来进行交易运算”(现任IBM技术布道者的Jim Kobielus语),也和Exadata更加接近。

 

 

SAP HANA

 

SAP的HANA战略, HANA Appliance只是 HANA的一部分,其余三个部分包括:数据库软件,HANA Studio,以及一套建模工具。

  正如SAP Sybase CTO卢东明在一篇博客中所说的,“HANA的理念更是全新,完全放在内存中做分析,列式数据库的技术+内存计算的技术,无需索引,无需物化视图,无需调优,性能上更上一层楼。”从这个意义上来看,似乎比起IBM和Oracle,HANA更胜一筹。

  不过,IBM的产品丰富性也让你无话可说。Kobielus说:“PureData System for Operational Analytics可以视为IBM InfoSphere Smart Analytics System的升级版,但这些系统都是构建在原有核心技术之上的新产品。”而PureData System for Analytics将基于IBM-Netezza数据仓库技术,用来探索大数据中蕴含的价值,它可以快速分析消费行为,避免客户流失,或者基于预测分析来创建一个精准定位的广告和推广项目。

  从目前的实际市场情况来看,包括Exadata在内的Oracle集成系统产品在国内的销售情况非常好,目前已经有超过了100多家的客户。而SAP HANA虽然在国内的销售情况并不如Exadata。当然,HANA在全球范围内却有着不错的增长势头。

  强大如IBM,即使有自家的一系列“专家集成系统”,也同时作为支持HANA的八家硬件合作伙伴之一,并在今年7月份的SAP中国商业同略会上与IBM共同发布了支持100TB主内存的HANA系统,这也成为卢卡斯面对埃里森“小”的批评的底气来源。

  在大数据即将井喷的市场,在HANA此前的Exadata之后,Exadata X3和PureData System的加入,无疑让这些软硬件集成的数据管理平台之间的竞争更为激烈,但对于用户来说,却是多了更好的选择余地。

 

 

  附价格信息:

  IBM:新的PureData产品将在10月底正式出货,IBM官方称一台PureData System的售价将从50万美元起,这其中包括所有的硬件和软件许可证费用。

  Oracle:虽然埃里森宣布新的硬件价格将保持不变,但是软件的许可证费用仍将占到用户投入的主要部分。而购买满配的Exadata X3-8,用户将至少投入上千万人民币;更小的配置即1/8配的机架,适用于入门级用户进行性能测试,但无法运行Oracle RAC,售价为20万美元。

SAP HANA: 根据内存中的数据量来定价(这与 Oracle 不同,Oracle 按 CPU 定价,还要加收测试与开发环境的费用)。一个 HANA 单位(1 个 HANA 单位 = 64 GB RAM)包含客户需要的所有生产、测试和开发许可,以及将数据导入 HANA 和实际使用产品所需的数据建模工具和管理工具。还有更好的:HANA 的价格会随着使用时间的加长而降低......买得越多,单价也越低。SAP Business One 的客户仅需支付 2,000 欧元,即可购买一个 HANA 的软件许可。任意客户支付 40,000 欧元就可以购买 SAP HANA Edge Edition。此外,我们还推出了每个 HANA 单位仅需 13,000 欧元的 SAP HANA Netweaver BW 版本。采购硬件设备还需要额外的费用,富士通(Fujitsu)等经过我方认证的合作伙伴处购买 HANA 服务器,单价只需 12,000 美元。低端用户(0.5 TB)使用 HANA 的软硬件总成本约为 50 万美元

 




Compare SAP HANA with Oracle Exadata

【前言】
本文的最终观点
:如果不是拿全公司的产品线来混合搭配,如果仅就一款产品而言,无论其它厂商如何宣传,目前整个IT业界还没有任何一款一体机产品能跟Oracle Exadata同场较量,TeraData不能,IBM PureSystem不能,SAP HANA也同样不能。而SAP HANA可能更应该拿自己去跟Exalytics作比较,而不是Exadata。

本文对于SAP HANA的认知来自于“SAP HANA Essentials eBook”以及Experience SAP HANA站点,完全属于纸上谈兵,如果有更熟悉SAP HANA技术的技术人员认为本文有失偏颇,欢迎指正。

【正文】
需要承认SAP HANA的出现,在理念上与Oracle Exadata几乎是完全一致的,SAP也意识到大量的数据要从缓慢的磁盘子系统中读取到计算资源中,这部分读取操作成为了最大的性能瓶颈,解决方法就是在计算时减少不必要的IO。对此,SAP HANA的解决方案是跳过磁盘层,通过压缩,将大量数据完全放到内存中,当然于此相配套的还有一些对于数据持久化的技术解决方案,但是无论如何,HANA作到的只是内存间计算而已,能够做到这一点,几乎完全得益于硬件的发展,如果不是当前内存容量剧增而成本却持续下降的话,几乎无法想象HANA能够成为普遍的企业级解决方案。

而与HANA相比,很明显Oracle Exadata在磁盘层读取技术上进行了大量创新,Smart Scan以及Storage Index等技术,都是更有意思的创造,从这一点而言,Oracle的创新更大,作为内存数据库+内存分析解决方案的Exalytics提供了跟Exadata的完美连接,如果需要分析的数据过于庞大而无法完全放置在Exalytics的内存中,那么仍然可以通过Exadata中的压缩,并行,智能扫描等创新技术来加速存储在磁盘中的数据的计算。这是一套更完善的解决方案,也更适合企业IT架构更平滑的过渡。

我们可以简单地认为SAP HANA是一个内存数据库解决方案(这可以与Oracle TimesTen相比较),或者称为内存计算解决方案(这可以与整合了Oracle BI,Oracle TimesTen以及Essbase的Exalytics相比较),这与Exadata的定位以及地位完全不一样。

说的更直白一些,凭着内存足够大,将数据都放到内存中,来获得计算速度的提升,这算什么创新的本事?内存大了,哪家数据库厂家花点儿心思在持久化保存上,都能这么干,这样并无核心竞争力。

以下列出一些分散的并不成体系的关于SAP HANA和Oracle Exadata的观点,同样,欢迎点评及讨论。

1. SAP HANA中列式表和行式表的转换也许是一个亮点。我想Oracle在Exadata中应该借鉴。

2. HANA迄今为止只支持报表应用,因此维护大并发需要的事务锁机制这个最大的技术难点目前看SAP还没有任何解决方案,那么这样的产品并不能与Exadata相提并论。事实是这样的:一直到2012年之前,SAP HANA的解决方案都称为SAP BW Accelerator,这需要一个独立的HANA数据库来完成BI报表,直到SAP BW 7.3 SP5 on SAP HANA的出现,HANA可以当作主数据库使用,不但是查询,而且企业数据改变也直接访问HANA,但这也仍然只是面对数据仓库以及BI领域的应用,这时候被称为SAP NetWeaver BW Powered by SAP HANA(说实话,这名字真够长的)。迄今为止HANA还未能宣布支持真正OLTP应用的案例。

3. HANA的数据持久化机制从文档上看,并无任何特殊之处,几乎与Oracle完全一样,通过将提交的事务写入log,来保证断电重启以后,可以重演log,这就是Oracle的redolog写机制。

4. 成本比较,HANA的硬件成本更贵,因为需要的内存更大;而同时只要企业真正业务产生的最原始数据是需要通过数据传输/同步手段(无论这个传输过程标称如何快速、如何实时)转移到HANA中的,HANA就还需要表复制,表同步的时间和人力成本;还需要额外的手段将SAP应用的相关报表数据迁移到HANA中,即使SAP宣称有快速的最佳实践部署方式,但是只要一种方式可以被称为solution,那就不会太简单。

5. SAP把HANA视为革命性地创新,试图打造一个围绕在HANA周边的原厂,合作伙伴,客户共同创造新应用的生态圈,虽然我们需要承认内存计算导致的应用延迟降低,确实具有其革命性的潜质,但是我仍然认为SAP期望过高。
HANA的多合作伙伴硬件一体机架构,可能会导致混乱。虽然SAP限定了CPU型号(Intel E7),内存型号(Samsung),以及操作系统版本(SUSE Linux SLES 11),但是每家合作伙伴的硬件设计工艺都不尽相同,服务能力也有差距,而SAP自身是否有足够能力同时保证七个硬件厂家(目前7家合作伙伴是Cisco, Dell, Fujitsu, IBM, HP, Hitachi, NEC)产品上运行HANA的性能,质量,可用性的测试认证,这也存在疑问。这并非一体机的好模式。

6. SAP的优势在于从ERP应用往下层延升,试图进入新一代数据库市场,而Oracle本来就占据数据库市场霸主地位,Exa系列的推出拓展了一片新的一体机天地,看看能否借助这样的优势,往上层延升,获得更大的ERP应用市场份额。

7. 在文档中多处看到了以Apple为例,看来Apple才是现今各种创新的源头,大家都从Apple那里学习和借鉴。各大厂商实际上都在尽量整合自己的解决方案,历来都如是,所以如果从这个意义上而言,其实从来就不缺乏一体机的概念。不过你有办法想象苹果的成功会来自于苹果提供iOS,指定芯片类型,而由三星或者诺基亚来制造手机吗?所以看上去Oracle在学Apple,而SAP在学Google的Android策略。

最后,有两个疑问能否有人帮我解答?
1. HANA的后台持久化磁盘存储也是共享磁盘,这是需要一个SAN磁盘阵列吗?那么一个HANA集群中的多个数据库实例是通过Share Everything的方式来共享访问这个存储?
2. 如果一个HANA节点挂掉了,这部分数据全部重新加载到备用节点的内存中,这个过程大约要花多长时间?我现在获得的数据是每秒钟扫描100TB数据集中的1000亿条记录(这个说法实在模糊,是扫描100TB数据还是扫描1000亿条记录,1000亿条记录又是多大数据?),每分钟可以加载1600万记录到内存中,这样的话,一秒钟扫描的数据也需要加载10小时才行?




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值