中国太平保险集团私有云平台建设实践

何宁 青云QingCloud

原文地址:https://mp.weixin.qq.com/s/1IUta4X59S1Wpw93UCvc1A

    前言:本文为中国太平运营管理处副处长何宁在青云QingCloud 保险沙龙上的技术分享整理而来。文中,何宁详细分享了太平保险集团独特的信息化建设之路,以及实现太平云建设的历程和多年积累的云计算实践经验,非常值得从业者借鉴与学习。

1 私有云是一个伪命题

关于太平集团
    太平集团是国内金融界有点另类的集团性保险企业,作为第一家在境外上市的中资保险企业,是唯一一家管理总部设立在香港的中管金融保险集团。太平集团经营区域涉及中国内地、港澳、北美、欧洲、大洋洲及东南亚等国家和地区;业务范围涵盖寿险、财险、养老保险、再保险、再保险经纪、互联网保险、资产管理、证券经纪、金融租赁、不动产投资、养老、养老产业投资等领域,业务种类齐全,为客户提供一站式综合金融保险服务。
    正是由于以上背景原因,太平集团的信息化建设之路可能与一般的保险公司有所差异,这样的差异对我们打造太平云也有着一定的影响。
我一直认为私有云是一个伪命题,可以从以下几个方面来看:
  • 从在线程度来看,公有云一定比私有云有更高度的在线程度;
  • 从数据流动产生信息从而生成价值的角度来看,公有云更有明显优势;
  • 从建设速度来说,公有云等于开箱即用,私有云需要部署、集成、调试步骤。
    这种情况下,肯定要有人提及安全问题。
    但是,从宏观角度来说,只要金融行业拥抱互联网,无论是公有云还是私有云,面临的安全问题都是一样的。去年的蠕虫病毒,公有云服务提供商没有受多大影响,但金融行业,不少企业的局域网里反而出现了不少问题。
    从微观角度来看,有什么证据能说明金融机构做信息安全的能力可以高于专业提供资源服务供应商的能力呢?
    当然,在公有云真正普及之前,未来的 5-8 年内,私有云还会在中国市场上生根发芽、枝繁叶茂,这是我们无法规避的阶段,就像社会主义初级阶段或者社会主义新阶段。

2 太平云建设规划:1 个目标,3 个要求

    去年,集团开始规划要搭建太平云,制定了 1 个目标、3 个要求。
    第一,这个云要建立在集团的范围内,不是只给某一个公司或者营业机构提供服务;
    第二,这件事情的整个周期为 8 个月;
    第三,最终衡量太平云平台的好坏不在于是否完成了建设,而是平台之上是否可以实现各种应用的价值。
我们当时做了一个计划,以太平集团旗下最大的太平人寿作为试点,试点成功后共享推广,最后形成真正的集团标准,在境内外使用。

3 两地三区域落地

    第一期,我们主要以建设 IaaS 为主,基本满足虚拟化、SDN,实现在此之上部署一些 PaaS 服务。这些服务基本是面向应用开发部门,让大家可以快速高效地拥有完备的应用开发测试环境。
    目前,太平云处在规划建设的 2018-2019 年阶段,建设中心是 I-PaaS ,我们更多的还是面向应用开发部门,为他们提供更好的 PaaS 服务,同时让更多的专业子公司使用这个平台。
    我们现在在做科技太平的课题。明年,我们会往下一个阶段发展,转向提供面向业务应用的 B-PaaS 或者 SaaS服务。比如客户画像或者认知识别,将来很可能会通过 B-PaaS 的方式交付给集团下属各专业公司使用。
    太平云的一期建设,从 2017 年 8 月份开始启动,12 月迎接第一次开门红,今年 3 月份收尾,用时 7 个月 30 天,比规划的要求提前了 1 天。
    一期规划落地的时候,主要实现的是“两地三区域”,我们有上海数据中心、武汉数据中心。上海数据中心被我们划为生产区域,武汉有开发测试和生产区域。
    去年,我们在上面使用了不少青云 OEM 的 PaaS 组件,目前匹配良好。我们把原来一些商务数据库上的东西迁移到 MySQL 上。
    其实 MySQL 本身的一致性的问题不好解决,青云在这方面做很多优化与实现,帮我们解决了不少技术难点。除此之外,非关系型数据库、缓存、Hadoop 等东西都已经放在了上面。
    在太平集团内部,私有云平台建设的出资方是太平人寿,托管给太平金科运营。其他公司,比如财险、寿险、养老、太寿香港等,他们做为用户方来租赁私有云。
    这就像是集团内部公有云,太寿出钱,金科运维,其他公司租赁。从集团的角度考虑,如果想要把新生事物顺利推广到集团范围内,建立管理制度和技术标准非常重要,这个理念在整个行业或者信息产业内都是一致的。
    所以我们一方面建私有云平台,另一方面建立私有云管理办法和准则;在此之上建立运营细则树立运维标准,指导实际运营工作;在运营和运维细则基础上,我们建立一套财务细则,制定各公司和金科的月度结算流程和标准。
此外,我们还制订了一套比较适合集团使用的服务目录,包括各个资源整合和分离的定价体系,嵌入了资源申请审批流程,增强了资源计费报表分析功能。这两部分比较贴近私有云而非公有云的客制化开发部分,要感谢青云的投入和产出。

4 太平云建设的五个阶段性成果

    太平云建设规划一期落地,实现了“太平云”平台的五个子目标,太平集团拥有了一个在架构和功能上都较完整、先进的,真正意义上的私有云。
    第一,给集团各单位提供统一、快捷、按需申请的基础设施分配服务。
    我们还有一个目标是建立能提供服务的基础上,还能用于支持服务配套管理制度体系。
    第二,面向应用开发能够提供开箱即用的开发平台、应用支持、安全防护等 PaaS 服务。
    这里有一个隐性目标,我们非常希望把开源的东西落进去。我们集团是一个比较传统的企业,拥抱开源需要创新的思维。我们    希望把在商务套件的支出慢慢转到开源项目上。但是,这里涉及一个概念,我们不能认为开源就是便宜,绝对不是,它只是资金支出方向不同 – 从对商务套件的授权的资金支出转为对内部人才培养的资金支出。
    第三,统一管理的多地域、多数据中心资源。
    我们想做异地灾备,想在今年或者明年尝试一些跨域的互联互通应用。
    第四,提供多租户方式下的调度管理和服务计费功能。
    我们想做利旧。现在国内每年开门红会购置一批机器。开门红一过,60-70% 的机器就有闲置压力。
当我们有了平台和资源,开门红只有一两天,在那个时间段里可以尽可能压缩测试区域资源,把里面的资源全部投入到生产区域;结束之后,再把资源释放回来,放在开发测试区域使用,这样资源投入不会短时间大幅度增长,而且既能兼顾开门红业务,也不影响平日开发测试。
    第五,满足现有虚拟化的资源需求,支持未来灵活的需求。
    我们希望有一个平台,除了可以纳管云平台之下的资源,还能将 VMware 、裸机等系统统一在一起管理。这样集团可以清晰知道哪些资源在用、哪些闲置、哪些该扩容、哪些该撤销,往资源集约化、降本增效的方向运作。

5 太平云端的业务实践

    平台落地后便是做应用,太平人寿成立了创新发展部,在云平台上做应用——太平云保就是这样一款互联网核心应用。

微销产品通过微信渠道销售各种各样的产品。这有点像众安的方式,但是众安的方式是以客户打通客户,微销则是通过代理打通代理和客户。


(说明:原图不清晰,转载时重新绘制了一下)

    如上图所示,上面是微销平台,下面有互联网核心系统。互联网核心通过消息队列慢慢有序的递交到传统核心系统里。总的来说,底下基础架构有云平台支撑,中间有互联网核心,上面有应用层支持创新业务。
    这件事挺有挑战,互联网核心平台去年 3 月份设计,6 月份完成,8 月 18 日启动私有云项目,9 月 4 日部署好上海站,经过两个月安全和压力测试,12 月初开始迎接开门红。
    开门红那天,早上 11 点资源遇到瓶颈,我们在云平台上用 16 分钟,扩展出 20 个节点。大概 15分钟后,资源占用一下就下来了,直到当天晚上 11 点,再也没有出现资源紧张的情况。
    一个新私有云平台加上一个新的互联网核心,在开门红的这一天,支撑了三分之一的保费。这还是比较有说服力的。

6 业务实践后续规划

    现在有了平台和应用,后续的计划主要分为四个维度:
    第一,纵向,希望满足各公司资源需求,实现预设目标;横向,希望各个专业公司新建系统都要云化。
    现在主要用的是寿险、金科,今年我们会把它推广到养老、太平香港、太寿香港、财险公司,目前资产公司也在运作中。更为重要的是,由于接入多、高并发业务多,我们希望青云私有云平台可以经受得住更激烈的考验。
    第二,从应用来说,它有集成性,毕竟私有云平台是新的,我们要想办法把传统应用集成起来。
    现在保险行业比较流行的做法比如秒赔、闪赔,要把非结构化的数据做前置,现在我们和青云合作也在探索如何把对象存储应用到这些业务中,把非结构化数据从后端移到前端。
    第三是制度,第一次制定云平台制度,一定会有不满意不科学的地方,还有优化的空间。尤其是考虑到境外监管机构要求和国内要求不太一样,未来,我们也需要建立在国际上能通用的制度。
    最后是创新,最重要的是开源创新。此外还有数据安全创新和基础网络部分的创新。

7 云平台建设中的 5 点思考

    最后跟大家分享我们做规划和建设过程中的一些思考:
    第一,平台价值的体现。
    我们认为一个平台服务的价值绝对不是体现在平台本身,平台本身是一个非常基础的东西。它真正要体现的价值是建立在平台之上的应用,以及应用所能提供的服务价值。
    第二,私有云和公有云的差异。
    青云是一家对私有云和公有云差异性有清晰认知的公司。公有云和私有云真正放在企业里,概念是不太一样的。公有云没有真正流程的概念。企业有比较严谨的审批流程、合规流程,要经得起考验、稽核以及审计,不是每个人想申请资源,就有资源。而这些都是公有云上不会考虑的。
    去年我们做了很多事情,把私有云独特的东西抽取出来,和青云做开发改进,青云也帮助我们解决了资源申请、费用结算等私有云比较独特的需求。
    第三,平台周边系统关系处理。
    太平集团的做法是一步步来,适合迁移的,我们可以逐步做迁移。现在没有实力、没有能力、没有精力、没有资金做迁移的,保持中庸的容忍。
    在用户体验一致性层面,我们尽可能把青云和原来的体系通过某些定制化开发来实现平滑的过渡。对于用户来说,他对迁移的感知度极小。
    网络层面来看,我们现在有两个数据中心,一个在上海,一个在武汉,中间是两根 1G 的带宽。如果你的底层核心在上海,你想让别的公司在武汉用,不解决网络问题,这件事很难推进。
    现在网络成本比较高,我们今年可能会尝试用裸光纤或者其他方式解决两地城际网络的问题。我们预计同一平台下的“两地三区域”访问能达到 4G 的城际网水平,但这是一笔不小的支出。
    第四,平台上的专业交流。
    既然都在一个平台上,当大家对于同一个问题感兴趣的时候很方便组织沟通交流,比如去年财险和寿险对 Spring Cloud架构的沟通交流。我认为这是平台带来的另一个附加好处,各个公司可以在技术层面上有共同语言,大家有共同研究的契机。
    第五,平台中沉淀的数据。
    对于数据分析和生命周期管理,太平集团一直在做。目前,已经将寿险、财险、养老等客户信息集中在一起,我们希望有精准的客户画像,提高将来产品投放的精准度。之前那套系统比我们后面想在私有云平台上做困难很多,我们现在也希望逐步把它移到开源的体系中去。
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目录 第1章 总体初步设计、工作方案 1 1.1. 总体框架设计 1 1.2. 技术路线 2 1.2.1. 基础网络 2 1.2.2. 基础设施 3 1.2.3. 服务支撑 3 1.2.4. 应用迁移 4 1.2.5. 信息安全 4 1.3. 实施产品清单 5 1.4. 实施工作内容 7 第2章 网络技术实施方案 8 2.1. 总体网络架构设计 8 2.2. 网络子系统 9 2.2.1. 云平台数据中心网络设计 9 2.2.2. IP地址规划 10 2.2.3. 路由协议设计 12 2.2.4. VPN设计 12 2.2.5. QOS设计 12 2.2.6. 可靠性设计 16 2.2.7. 安全性设计 17 2.2.8. 网管设计 19 2.2.9. 云平台IDC虚拟化部署 20 第3章 云平台机房技术实施方案 24 3.1. 系统概述 24 3.2. 云平台机房概述 25 3.2.1. 建设标准 25 3.2.2. 地理位置 27 3.2.3. 电力系统 28 3.2.4. 制冷 30 3.2.5. 消防 31 3.2.6. 安保监控 32 3.3. 数据中心机柜资源规划 33 第4章 云基础设施(IAAS层)技术实施方案 35 4.1. 云计算基础架构体系 35 4.1.1. 设计原则 35 4.1.2. 系统总体架构 36 4.2. 云计算中心网络层设计 44 4.2.1. 设计思路 44 4.3. 云平台网络系统整体架构 46 4.3.1. 整体架构设计思想 46 4.3.2. 云平台内网网络系统设计 48 4.3.3. 云平台中心核心交换区 49 4.3.4. 云平台中心云资源池区 50 4.3.5. 云平台中心运维管理区 51 4.3.6. 外联安全接入区 51 4.3.7. 云平台内网接入网络设计 52 4.3.8. 云平台内网网络系统设计总结 53 4.3.9. 云平台网络关键技术支撑 54 4.4. 虚拟网络规划 55 4.5. 服务器设备清单 56 第5章 软硬件实施详细方案 58 5.1. 华为防火墙安装部署 58 5.1.1. 配置备防火墙上的NAT 58 5.1.2. 配置双机热备份模式 59 5.2. 华为服务器安装部署 61 5.2.1. 服务器安装流程 61 5.2.2. 服务器上架安装 62 5.2.3. 配置RAID 64 5.3. 浪潮存储AS520-E安装部署 69 5.3.1. 设备登陆 69 5.3.2. 创建资源池 69 5.3.3. 创建RAID 70 5.3.4. 自动镜像故障迁移 71 5.3.5. 创建主机组 71 5.4. VMWARE VCAC安装部署 72 5.4.1. 部署VCAC Indentity 72 5.4.2. 部署VCAC Appliance 75 5.4.3. 安装配置工具 78 5.5. VMWARE VSPHERE安装部署 80 5.5.1. 方案拓扑 80 5.5.2. 方案构成部分详细说明 81 5.5.3. 硬件资源分配 83 5.6. WINDOWS域控部署 101 5.6.1. 数据中心父域控搭建 101 5.6.2. 协会内网新建子域 103 第6章 项目管理计划 104 6.1. 云平台部署流程 104 6.2. 项目管理计划 105 6.3. 项目人员职责 105
近年来,XX保险秉承打造国内一流保险公司的目标,不断创新,业务高速发展。同时,由于行业外部激烈竞争,使得业务部门对于IT部门支撑职能的要求越来越高,如何通过有限的资源,实现服务质量、业务创新、成本控制等多方面能力的提升,是摆在IT科技人员面前无法逾越的鸿沟。 保险行业作为一个高度依赖IT信息化的行业,其典型的IT运维特点是业务全年不中断,所业务流程均需要高度依赖IT技术,并且法规对数据安全性和业务可靠性要求极高。然而,多年以来,国内的大多数保险公司依然通过传统的方式,一直在向本已脆弱的数据中心基础架构添加服务器和存储设备,以便持续满足新的关键业务应数据库,以及各类定制应用程序的需求。这些新增服务器和存储带来了前所未有的 IT复杂性和低效率,并导致TCO增加,服务质量下降。 过去的数年,随着虚拟化技术的应用和云计算模式的发展,信息化平台从最初的服务器堆砌模式转向了虚拟化资源池的方式,并尝试引入了云管系统实现了初步的私有云平台,但随着当下数字化转型的驱动,单一的虚拟化资源池或私有云平台,已经无法满足保险公司对新兴业务的支撑需求。尤其是基于传统共享存储架构的虚拟化集群,更是称为新兴技术和架构的桎梏,严重影响了保险公司数字化转型的效率,降低了数据治理和价值挖掘的能力。 如何借助新兴的技术架构,如公有云、微服务、容器化、软件定义网络等,来完善升级现有数据中心和信息化平台,是保险公司数字化转型的基础。而,这些新兴技术同样对带来人员、组织和管理制度上的挑战。 如何拥抱数字化转型,构建面向未来的保险信息化服务平台,是XX保险当下IT科技人员需要面临的一个问题,也正是本次项目所讨论的重点。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值