【题记】五月的北京,天气日渐燥热。北京王府井东方广场大厦里,银华基金 CTO周南却心平气和、游刃有余地检查着公司IT状况。周南有着典型的IT人特征,工作的时候仔细认真、一丝不苟,但却并没有IT人普遍的焦虑与不安,他的脸上始终透着一股平静与自信。闲暇之余,笔者借 数据中心的话题与他攀谈起来,数据中心管理、 小型机X86服务器、备份与容灾、 固态硬盘……等热点话题也让周南的话匣子随之打开。
   数据中心迁移—重生的绝佳良机
  作为年收入近10亿元的国内大型基金公司,银华基金的数据中心承载着重要的作用与责任。特别是基金公司IT具有三大核心业务:传输、表达与计算。随着这几年基金行业的快速发展,如果IT建设不能紧跟甚至推动公司业务前进的话,那么将很难面对未来市场越来越激烈的竞争。
  银华基金CTO周南回忆当初数据中心建设时仍然心有余悸:“银华基金成立于2001年5月,在2007年之前,整个公司的核心业务与数据中心其实是在深圳,在那几年里,公司业务规模经历了巨大的变化,特别是从06年起,随着股市迈入牛市以及日后的震荡,基金公司的作用日趋显现出来。在07年之前,整个公司的IT建设基本是一个被动的过程,业务有何需求,IT随之改变来满足它。这样做的持续结果是:到2007年,深圳数据中心在电源系统、 机房空间、机柜机架、散热 制冷等方面一片混乱,管理效率极为低下。IT部门人员从早到晚忙得晕头转向,成天提心吊胆地担心这 服务器出问题、那 交换机出岔子,完全没有时间来思考IT在满足业务发展需求时,如何去推动业务的前进。”
  2007年,银华基金做出了一个重大的决定:出于公司业务发展需求的考虑,公司核心业务由深圳迁到北京,这意味着银华基金的数据中心也需要随之迁移。周南认为这对于公司的IT建设是一次重生的绝佳良机。因为他们可以根据公司的业务现状及未来的发展趋势,重新选择机房地址、更加合理的规划机房空间、选择更为优秀的技术与平台。
  周南在谈到这次迁移时非常有感触:“这次数据中心的迁移可谓是给我们提供了一次彻底解决问题的良机。2007年之前遗留下来的问题,我们通过这次数据中心迁移全部解决了。出了业务发展需求的考虑,我们将四台Sun 小型机上的核心业务迁移到了IBM Power平台上,同时针对北京数据中心机房空间,在电源系统与散热制冷系统上做出了重大的改进,并且进一步完善了网络架构与数据安全。这才有了现在这个能较好满足业务发展的数据中心。可以说这次数据中心的迁移以为着一次重建。如果没有这次良机,也许现在我还在机房中忙碌的解决各种问题。”
  银华基金的IT建设情况可谓是国内公司的典型代表。在公司初期,业务发展是重中之重,IT建设与数据中心往往只能担任配角,仅仅是跟随业务发展而发展。慢慢地随着时间的推移,公司越来越明白IT的重要性,却因为前期IT规划的严重匮乏,让IT建设走入举步维艰的境地。国内有很多公司像银华基金那样,在短时间内业务得到蓬勃发展,但是国内又有机架公司像银华那样幸运,能够因为业务发展而获得一次数据中心重建的机会?现实的情况是:国内大部分公司(特别是那些短时间业务发展迅速的公司)的数据中心管理人员每天都迷失在忙碌、混乱、效率低下的数据中心工作之中。这足以说明数据中心建设的规划与业务发展如何协调的重要性。
  数据中心的规划发展与业务发展似乎永远都是一对“矛盾”。公司业务发展的变化可能瞬息万变,业务发展的初期,数据中心的建设往往是跟随业务发展的脚步,业务需求的快速、巨大改变使得数据中心的初期规划很难满足这种需求。这不仅仅是银华基金面对过的难题,而是大部分公司现在或将来在面对的难题。银华基金通过数据中心重建获得了重生,那么其他公司呢?其他公司也只有通过数据中心重建获得新生?其他公司就没有更好的方法与策略来应对公司业务发展的改变?但愿银华基金的真实经历能够给大家提供一些有用的经验和深刻的思考!
  服务器的选择—银华为何钟情小型机的群狼战术
  提到 数据中心,就不能不提肩负 企业核心业务计算任务的服务器平台。对于基金公司来说:业务需要部署大量的信息系统,以联机事务处理(OLTP)的计算类型为主,对实时性计算的高效性有着极高的要求。这就对服务器平台的计算能力、并发事件处理能力、 虚拟化能力提出了较高的要求。
  银华公司采用四台IBM P560Q+多台P55A小型机来搭建数据中心计算平台。银华基金 CTO 周南称之为群狼战术。令人非常诧异的是,即便是在Unix领域上虚拟化技术非常成熟的Power平台上,银华基金并有在上面部署太多的虚拟化应用,而是采用分而治之,利用多台低端小型机部署全部应用来满足业务的需求。
  笔者带着巨大的疑问询问这是为何?银华基金CTO周南欲言又止:“为什么采用群狼战术,这是因为之前有惨痛的教训。IBM P560Q的确是好机器,具备非常强大的计算能力和虚拟化能力,之前我们也是充分发挥其虚拟化的能力,在上面部署了众多核心应用。但是有一次数据中心 制冷系统出现漏水,刚好把一台P560Q给烧了,虽然后来经过多方辛苦的努力,才将业务恢复过来。要知道基金公司的业务是不能够出现中断的,如果出现中断那将给公司、客户带来巨大的损失,基金公司也承受不了这种中断。之后,我们明白不能把所有鸡蛋都放在一个篮子里,因为你永远都不知道哪里可能出现错误,从而引发整个机器的崩溃。我们后来就采用了四台IBM P560Q+多台P55A小型机的群狼战术来应对各种变化。”
  既然采用的是群狼战术,为何不采用 X86服务器进行替代呢?银华基金CTO周南表示:“X86平台在价钱上的确有比较大的优势,我们公司也认识到这一点,下一步我们将尝试将一些应用逐步部署在X86服务器上。”
  周南还表示:“对于金融行业的用户来说,还是以安全为主,所以金融行业的用户对技术的吸收程度往往落后1-2个阶段。”就像周南所说,基金公司在技术选择上相对比较保守,但是保守在某种程度上并不代表着贬义。就像银华基金那样,公司已经具有一个相对比较稳定的数据中心计算平台,小型机在这其中发挥的作用虽然可能可以通过迁移到X86平台来实现,但是又会有哪家企业会为了迁移到X86平台而大动干戈,将本来运营平稳、发挥良好的小型机平台弃之不用呢?所以,对于用户来说,万万不能为了X86而X86,或者为了小型机而小型机,而是需要根据自身的实际情况,做出最为合理的决策。就像银华基金那样,小型机能够带来高可靠性和高安全性,这些特性能够非常好的满足基金行业核心业务的需求;同时,根据实际情况,将一些其他应用迁移到X86平台上则可以很好的节省成本,最终使得自身的数据中心计算平台更为合理。
手工备份—吃惊之余的思考!
  对于基金公司来说,交易型的数据就是他们的核心与生命,每天大量的交易数据需要及时的进行备份与归档,同时还需要对各种应用做好容灾工作,以此来确保各种灾难而引发的业务中断。同样令人惊讶的是,银华基金公司并没有采用备份软件,现在还是采用手工进行备份,这倒是又是为何呢?银华基金在容灾建设方面又会有何特点呢?
  银华基金 CTO周南表示:“之前我们也一直在考虑像赛门铁克Veritas、Commvault Simpana等备份软件,也有人推荐过,但是考虑到我们每天的数据量只有几GB,数据量不大,种类又很单一,因此每天做一个全备份,然后压缩完后通过2M的专有线路传输到深圳备用 数据中心。相对来说,基金公司可能更加关注网络与数据安全,比如说外部的 ***病毒***,内部的老鼠仓等等。”
  国内大型基金公司的银华基金尚且还处于手工备份的阶段,其他基金公司目前在备份领域的水平就可想而知了。目前,在备份技术领域,除了备份软件传统的备份功能外,各大厂商纷纷将 CDP快照等技术应用到备份技术当中,使得备份逐步抛弃过去那种一周做个全备份、每天做增量备份的传统备份策略,从而成为一种简单有效的工作。虽然现在手工备份能够适应公司业务的需求,不过随着银监会对金融行业、特别是证券行业在法规遵从方面要求越来越严格,这就决定了手工备份迟早要走向淘汰。周南也表示:“现在银监会对基金公司的IT建设要求越来越正规化,特别是法规遵从方面促使基金公司在IT建设上逐步的完善自己。”
  对于容灾方面,银华基金在同城采用HA的方式进行保护数据,在深圳建有备用数据中心,深圳数据中心跟北京数据中心有1天的差别。周南承认在容灾工作方面还需要做很多工作:“目前我们在同城容灾中只能做到数据级保护,应用级的容灾还没有达到,另外银监会对容灾的要求也越来越严格,实现实时同步是我们容灾建设下一个工作的重点。”
  对于基金公司来说,保持业务连续性显得尤为重要。而在灾难之中,逻辑错误(应用软件缺陷、系统缺陷、人为误操作)与硬件故障等常规问题出现的概率远远大于自然灾难的概率,对于对业务连续性要求极高的基金公司来说,如何从这些灾难中快速恢复就成为重中之重。周南对此非常认同:“灾难的快速恢复能力对基金公司非常重要,因为这关系到公司核心业务发展,银华也一直努力在完善这方面。”
固态硬盘 与内存 数据库 —天生为我所用?
  银华基金 CTO周南有着IT人热爱探讨技术、兼收并蓄的典型特征,这点在笔者与他探讨固态硬盘上显得尤为突出。笔者介绍利用基于PCI-E的固态硬盘来提升 服务器的IO处理能力时,他表现出浓厚的兴趣。
  固态硬盘凭借其高IO处理能力、低功耗等特性获得了厂商与用户的青睐。对实时性计算与并发处理能力要求极高的基金公司,其实非常适合采用固态硬盘。比如当前以Fusion-IO为代表的基于PCI-E固态硬盘在国外应用就非常广泛,用户将此种固态硬盘插入 X86服务器,从而大大提升服务器的IO处理能力,此种技术非常适合各种 数据库应用
  周南则认为:“这种技术如果容易部署的话,那的确对于提升服务器IO处理能力有很大的帮助,今后这方面的技术非常值得我们关注。其实最近很多人向我们推荐了内存数据库,内存数据库跟传统数据库有很大的区别,当前数据库放在内存之中,历史数据库放在传统位置,这种数据库专门为联机事务处理设计,包括数据表的格式也与传统数据库有着巨大的区别,整体上完全是为了高IO来设计。”
  其实无论是固态硬盘还是内存数据库,目的都在于满足实时性数据处理的业务需求,难能可贵的是银华基金CTO周南在工作中一直保持着对这些新兴技术的关注与了解。“IT技术的发展始终日新月异,如果不及时了解和学习一些新的技术,马上就会被淘汰。”周南发出如此感慨。
   总结:
  银华基金的IT建设经历了从初期的配合业务角色,到目前推动业务发展的阶段,这个过程虽然经历了种种困难,但在CTO周南的带领下,银华基金很好的从业务角度出发,并没有一味的相信或者排斥新技术,而是根据当前IT建设的实际情况,审时度势的做出有优化的决策。业务永远都是在发生变化的,因此没有做的最好的IT建设,只有更好的IT建设。虽然银华基金公司目前IT建设能够很好的满足业务发展需求,但是周南并不满足这一现状。相信在未来,银华基金的IT建设在周南的带领下,会去的更大的成功!