金融创新加速:浙商证券GPU池化技术提升业务效能

随着科技的飞速发展,金融行业,尤其是证券行业,正面临着日新月异的变革。在这个充满挑战和机遇的时代,浙商证券股份有限公司作为深耕浙江本土、致力走向全国的快速增长的区域性券商,业务规模逐年扩大,市场地位稳步提升。公司始终紧跟时代步伐和行业节奏,顺应行业竞争趋势,不断提高金融科技水平,以创新为动力,积极布局人工智能等前沿技术,助力业务拓展,提升公司核心竞争力。

 图1. 浙商证券股份有限公司上市仪式

1. 背景介绍

浙商证券股份有限公司(ZHESHANG SECURITIES CO.,LTD.)是经中国证监会批准成立的综合性证券公司,原名金信证券,成立于2002年5月9日,2006年8月更名为浙商证券,总部位于浙江省杭州市。

浙商证券始终致力于综合投融资服务,管理居民财富,积极服务实体经济发展,逐步构建综合金融产业布局,旗下设浙商资本、浙商资管、浙商期货、浙商投资、浙期实业、浙商国际(香港)、浙商国际资管(香港)七家子公司,百余家分支机构遍布全国22个省份,服务覆盖珠三角、长三角和环渤海三大经济区,在全国最活跃的省份打下了综合投融资服务的基石,形成全国性财富管理网络布局。

2. 客户面临的算力挑战

目前公司的OCR、信息提取、智能审核比对等系统均运行在GPU算力上,其中OCR的应用场景最多——利用OCR技术快速准确地识别客户身份证明文件、银行卡、交易单据、投资研报等资料上的文字信息,可大幅提升信息录入的效率和准确性,提高交易效率。除了上述应用,随着大模型的兴起,公司不同的业务部门也在纷纷尝试通过AIGC赋能业务创新,由此围绕GPU算力使用及管理产生的问题和挑战也日渐明显,具体表现为以下三点。

1. 业务需求多和算力不足:随着AI模型规模的扩大和复杂度的提高,业务对GPU资源的需求也在不断增加,各业务部门需要更多的GPU来支持模型的训练、优化和部署。然而GPU采购时间周期长,难以及时满足业务需求。

2. 硬件成本高和算力浪费:当前业务都是跟GPU卡绑定,且现有的应用都是通过虚拟机或容器直通GPU卡的形式在进行部署,大量计算资源在业务空闲状态下被浪费,高居不下的硬件采购成本与资源利用率低下的矛盾难以调和。

3. 运维管控难和算力分散:当前业务应用使用的GPU卡都分布在不同的IT资源孤岛中,各算法厂商部署要求不同,架构未经统一规划,各个系统为烟囱式竖井结构。随着业务应用的增加,如何管理各IT资源孤岛中的GPU卡也会愈加复杂,连最基本的利用率信息都需要人工通过命令行获取,给公司的IT团队带来了额外且繁琐的工作量。另外,当前业务跟GPU卡绑定、且多个业务在同一个GPU服务器上操作的使用方式,没有隔离措施,存在不同业务之间相互影响的安全风险。

为了解决这些问题,公司亟需升级IT基础设施,提高资源利用效率,实现降本增效,以支持业务的持续创新和拓展。

3.解决方案

基于详细的市场调研以及对各厂商的技术路线分析,浙商证券采用了趋动科技OrionX GPU池化解决方案,该方案通过软件定义GPU,构建数据中心级AI算力资源池,使应用无需修改就能透明地共享和使用数据中心内任何服务器之上的AI算力。

图2. 浙商证券GPU池化业务架构

OrionX基于最新的软件定义AI算力理念,颠覆了原有的AI应用直接调用物理GPU的架构,将AI应用与物理GPU解耦,AI应用首先调用逻辑OrionX vGPU,再由OrionX将OrionX vGPU需求匹配到具体的物理GPU,从而让业务部门高效、智能、灵活地使用GPU资源,从而很好地解决了现有的算力挑战。

1. 算力池化按需供给:通过OrionX将GPU算力资源整合在一起,形成一个虚拟的GPU资源池,支持算力资源的细粒度按需供给释放,以满足不同业务部门同时使用GPU算力的需求。同时引入资源配额功能,能有效避免资源争抢,确保不同用户或用户组的资源使用上限,实现资源的公平分配,解决算力短缺的问题.

2. 资源动态申请及回收:GPU资源池化之后,业务与GPU卡解绑,业务只有在真正需要GPU算力的时候才能动态按需地从算力池中申请到资源,且在使用完成之后会将算力立即释放到资源池让其他的业务使用;OrionX支持物理与虚拟GPU同时使用,有效合理地利用各种资源。这种技术不仅提升了资源的利用率,降低了硬件采购成本,而且通过创新的资源超分机制,科学合理地利用了闲置资源。

3. 全局管控打破孤岛:OrionX资源池配有统一的管理平台,可对各部门下所有GPU资源实现全局运维和监控,让GPU资源管理变得直观便捷,使开发者能够更专注于创新和开发工作本身。业务可以在资源池内开通容器或虚拟机,通过远程访问GPU资源池里的算力资源,彻底消除了之前不同业务在同一台GPU服务器上操作带来的安全风险。

图3. 池化部署前后的架构对比

4.方案收益分析

趋动科技OrionX GPU池化解决方案给浙商证券带来的价值主要体现在以下几个方面:

1. 业务创新速度加快:支持算力按照1%粒度、显存按照MB维度切分,满足业务部门不同AI应用的部署需求,目前已对接适配庖丁、易道博识等厂商系统及自研系统10多个。通过动态调整GPU资源而无需重建容器的方式,GPU资源准备时间从原来的20秒减少到4秒,大大加快了业务创新速度。

2. 算力成本持续降低:通过切分功能,OrionX将Nvidia高端GPU卡灵活切分成规格不同的12份,使不同业务叠加部署在一张GPU卡上;同时支持AI应用和GPU卡分离部署实现算力的远程调用,2台高端的GPU服务器+8台CPU服务器的搭配就能满足业务需求,GPU服务器节省75%。

3. 运维风控能力升级:OrionX实现了对数据中心所有GPU卡的一站式管理运维,支持一键导出GPU卡在不同时间段内算力和显存的利用信息,以及业务在不同时间段对算力的申请和使用信息等。相较于原来的人工登录查询的方式,效率提升90%以上。此外,支持通过远程调用的方式访问GPU算力,将业务跟GPU算力进行彻底解耦,完全杜绝了不同业务之间相互影响的安全风险。

5.客户评价

通过采用趋动科技OrionX GPU池化解决方案,浙商证券不管是在业务运行,还是在技术创新方面都取得了显著的成果。

对此,公司IT部门负责人曾老师表示:“OrionX为我们提供了一个高效、灵活的计算平台,满足了业务高速发展的需求。同时,OrionX的运维管理简单便捷,大大降低了我们的工作负担,特别是通过GPU远程调用解耦了业务和物理GPU卡,杜绝了业务之间相互影响的风险,这点在金融领域尤其重要”。

6.未来展望

浙商证券通过采用OrionX GPU池化解决方案,实现了业务创新加速、算力成本降低以及运维风控能力升级等实际收益。

未来,浙商证券将继续秉承科技创新的理念,进一步探索AI赋能业务创新。趋动科技将继续支持浙商证券深入探索OrionX GPU池化解决方案在信创领域的应用,拓展金融业务的边界,为浙商证券的客户提供更加全面、个性化的金融服务!

  • 10
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值