必须建筑师附体!像盖大楼那样打造数据即服务

近两年产业界总用“数据洪流”来形容数据的大爆发,但如果我们真把它视作洪水,那么它只会带来冲击;如能积极发掘其潜藏的价值,它则可能变成一条流金之河,正如麦肯锡在研究中发现的那样:与竞争对手相比,能使用数据识别客户行为的企业,在销售增长率方面要高出85%,在毛利率方面会高出25%[1]


640?wx_fmt=png


这个道理,其实大多数企业都清楚,但要构建完善的数据处理和分析平台,难度并不比构建AI应用平台低,对他们而言,通过公有云服务获得这种能力反而更现实。


640?wx_fmt=png


那么,云服务提供商应该怎样做,才能打造出一个高效、全面和可靠的数据即服务呢?根据先行者们的经验,导入“建筑师”思维是必需的,也就是说,要用盖大楼那样的思路来构建数据即服务。

 

就像起高楼必须先挖地基一样,云服务提供商首先要考虑数据即服务的“地基”,也就是数据存储的问题。在各行各业全面拥抱数字化趋势的今天,存储服务的要求更多地体现为:容量和性能要实现高效扩展,相关资源可进行灵活调配和快速交付。

 

接下来,在数据存储的“地基”之上,要筑起坚实的“楼体”,也就是提供数据库即服务,将繁琐的数据库预置、配置、优化、备份、安全、监控、联网、自动化、升级及维护等操作,全部交给自动化数据库管理系统来处理。

 

640?wx_fmt=png


最后一步,就是要在“楼体”上加装顶层,也就是大数据或数据分析即服务,海量数据将通过它的清洗、挖掘、分析和可视化等操作,提炼出高价值、易理解和检索的关键信息,或者说是洞察。

 

640?wx_fmt=png


云服务提供商还需要确保上述不同层级间各模块和功能之间能形成协作,而非各自为政。如金山云的数据即分析服务KMR(Kingsoft MapReduce),就与其对象存储KS3、表格数据库服务和关系型数据库服务(KRDS)实现了集成。其用例之一,就是用户可在得到分析结果后将其存入KS3,然后释放按时计费的KMR集群,以节省成本[2]


640?wx_fmt=png


有了设计思路,云服务提供商就要操心“钢筋水泥”,即基础设施的选择了。由于这个体系自下而上,对硬件的需求从重存储,渐渐过渡到重计算,所以这两点就是考量的重点。

 

先谈存储,数据即服务应优先考虑软件定义存储,它利于创建跨服务产品使用,且易于管理和调配的共享存储资源池。

 

英特尔平台+Ceph技术是实施软件定义存储的理想之选。Ceph是目前唯一能提供开源存储、软件定义存储、企业级存储和统一存储(对象、块和文件)的解决方案。它与至强处理器搭配,再辅以英特尔智能存储加速库(让应用能使用至强加速与数据保护、完整性和安全性相关的任务)、高速缓存加速软件(让Ceph可通过智能缓存提高性能),以及高性能、低延迟、高稳定和耐用的英特尔固态盘和傲腾固态盘等技术,可输出令人满意的性能和总拥有成本。


640?wx_fmt=png


再谈计算,英特尔的优势更加明显:不仅有新一代至强可扩展处理器凭借全新微架构带来的加成,还有诸多开源和商业版本数据库及数据处理和分析技术,如Apache Hadoop、Spark、SAPHANA带来的“众星捧月”效果。两者融合就产出了一串更诱人的数据,如SAP HANA每小时执行的查询量可提高至1.5倍[3],IBM DB2批量分析的平均速度提高至1.4倍[4]


640?wx_fmt=png


这些英特尔新技术带来的功效可不是纸上谈兵,抛两个身边的真实“战例”:

 

-      腾讯金融云TDSQL服务升级采用至强可扩展处理器、英特尔Omni-Path架构和傲腾固态盘,写性能提高至原来的3倍,读性能提升到原来的4倍,整体性能提升至原来的1.7倍[5]


640?wx_fmt=png


-      用友分析云平台在升级使用至强铂金8180处理器后,性能归一化指标比使用至强E7-8890 v4时提升42%,搭配傲腾固态盘后,性能更是提升达92%[6]

 

640?wx_fmt=png


数据与信息来源:

[1]: 麦肯锡,2017年,《利用您的客户数据获取价值》,https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/capturing-value-from-your-customer-data

[2]: 白皮书《金山云助力实现云端数据分析》,https://www.intel.cn/content/www/cn/zh/cloud-computing/kingsoft-cloud-enables-data-analytics-in-the-cloud.html

[3]、[4]:白皮书《数据分析:面向云服务提供商的指南》, https://connect.intel.com/analytics_eguide_reg

[5]: 白皮书《铸就智慧金融的“芯”动力——英特尔助力腾讯云提供基于TDSQL的高效、安全金融云服务》,https://www.intel.cn/content/www/cn/zh/cloud-computing/tencent-financial-cloud-case-study.html

[6]: 白皮书《英特尔技术助力用友分析云向用户提供全分析服务解决方案》,即将上传。

 

并发、时延、成本等各方面,都对云平台的基础设施提出了更高的要求。点击阅读原文,登上至强特快专列,了解成功的云服务提供商如何高效打造差异化的云服务。


640?wx_fmt=jpeg


详情请查看【阅读原文】

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1.系统概述 基于区块链技术的医疗数据存储和传输系统是一种安全、透明、去中心化的医疗数据管理系统,可以有效保护患者的隐私和数据安全,提高医疗数据的可靠性和可用性,方便医疗机构和患者之间的数据共享和传输。 2.系统特点 (1)安全性高:采用区块链技术的去中心化存储和加密传输,确保医疗数据不被篡改、窃取或丢失。 (2)透明性强:所有医疗数据都被记录在区块链上,任何人都可以查看和验证数据的真实性和完整性。 (3)数据共享方便:医疗机构和患者可以通过智能合约进行数据共享,保护患者隐私的同时,提高医疗数据的可用性和共享性。 (4)数据跟踪追溯:区块链技术可以记录医疗数据的历史记录和更改记录,方便数据跟踪和追溯。 (5)智能合约管理:通过智能合约进行医疗数据的管理,自动化执行数据共享和授权等操作,提高数据管理效率和准确性。 3.系统架构 系统数据采集、数据存储、数据传输和数据共享四个模块组成。 (1)数据采集模块:负责患者医疗数据的采集和处理,包括基本信息、病历、检查结果、诊断报告等。 (2)数据存储模块:采用区块链技术进行去中心化存储,确保数据安全可靠,每个区块包含多个医疗数据,每次新增数据都需要进行验证和加密。 (3)数据传输模块:基于区块链技术实现医疗数据的传输和交换,支持跨机构的数据传输和共享,通过智能合约进行数据授权和管理。 (4)数据共享模块:支持医疗机构和患者之间的数据共享和传输,保护患者隐私的同时,提高医疗数据的可用性和共享性。 4.系统流程 (1)患者就诊:患者就诊时,医疗机构会对患者进行医疗数据采集和记录,并将数据上传到区块链上。 (2)数据存储和验证:区块链节点对新数据进行验证和加密,然后将数据存储到区块链上,形成新的区块。 (3)数据传输和共享:医疗机构和患者可以通过智能合约进行数据共享和传输,保护患者隐私的同时,提高数据的可用性和共享性。 (4)数据管理和授权:通过智能合约进行数据管理和授权,自动化执行数据共享和授权等操作,提高数据管理效率和准确性。 5.系统优势 (1)保护患者隐私:采用区块链技术进行医疗数据的存储和传输,保护患者隐私和数据安全。 (2)提高数据可靠性:通过区块链技术进行去中心化存储和记录,确保数据的真实性和完整性。 (3)方便数据共享和传输:通过智能合约进行数据共享和传输,方便医疗机构和患者之间的数据交换和共享。 (4)数据跟踪和追溯:区块链技术可以记录医疗数据的历史记录和更改记录,方便数据跟踪和追溯。 (5)提高数据管理效率:通过智能合约进行数据管理和授权,自动化执行数据共享和授权等操作,提高数据管理效率和准确性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值