不是你不会做菜,你只是缺个好厨房:深谈御膳房架构演进

本文根据阿里巴巴高级技术专家朱震杰在大流量高并发互联网应用实践在线峰会上题为《御膳房架构演进》的分享整体而成。在分享中重现了御膳房在探索大数据开放处理平台的道路上应对用户迫切需求和技术架构以及安全上的强大挑战。分享期间,朱震杰还重点剖析了御膳房在基础数据加工和高阶数据加工方面的能力,并对安全加固进行了详细讲解。 

直播视频点击此处观看

幻灯片地址点击此处下载

以下为在线分享观点整理。


御膳房-由来

为什么要有御膳房这个产品呢?

 

a2b8e0d38f717f9de7ac9110d458bfb92fcaf1d0

在DT时代,阿里集团战略中关键一环就是让商家通过使用数据来提升业务,也就是常说的数据赋能。初期,阿里通过官方数据产品的形式来满足商家的需求,让商家感知店铺的运营状况,利用数据驱动运营;但随着商家规模的变化以及对数据的认知发展到一定程度,官方数据产品很难满足商家定制化的需求。这时,需要一种更加灵活的方式让数据赋能商家,御膳房就是在这个战略下应运而生,让商家自主使用数据的地方。御膳房的产品形态是希望通过赋能商家及其合作伙伴,让其安全的利用阿里与自身的数据进行业务优化,从而驱动阿里电商生态向DT转型。

御膳房面临的挑战

c29e736f5e7b90238ead3b0ddbb6b824142f4216

御膳房需要是一个全新的产品模式,既要合作伙伴用到阿里和其它来源的数据,又要求合作伙伴在处理的整个环节保证安全,数据资产不泄漏。要完成上述这些工作,御膳房面临着多方面的挑战。安全方面:首先阿里作为平台方提供的数据的商业价值不能泄露:其次阿里平台上消费者的隐私不能泄露。同时,多个商家使用御膳房时,相互之间不能干扰,这就要求数据、资源、运行时环境等相互隔离,并可独立计量。

御膳房的模式探索

b842effe150f6a78a66c020fe2198f2a38d4bacd

在御膳房模式探索中,发现了两类接近的产品模式:一是OpenAPI架构,该架构是数据导出型架构,也可以理解成插管式数据开放,如开放平台、数据市场。数据资产一旦通过API调用之后,调用方很容易对这部分数据进行缓存或存储,进而把这部分数据占为己有,这样就严重损害了阿里的商业利益,同时该架构并不能很好地解决商家及其合作伙伴后续面临的大数据加工处理的难题。

另一种思路是偏学术界的密码学体系,如同态加密或多方安全计算,前者是在加密的数据上进行任意计算,计算完的结果解密和正常计算结果一致,相当于用密码给数据资产加了一把锁,这需要消耗大量的计算资源;多方安全计算是指在缺乏可信平台的情况下,双方或多方需要知道共同的计算结果,但彼此的数据内容保密,这其中涉及复杂的加密、通信协议和交互,从而导致信息的交换效率较低。

也就是说我们当时同时面临了商业和学术上,两个看上去无法解决的问题。

御膳房架构模式

409a7e470bd5d2994d02cc0a225d91c9250296ed

御膳房结合阿里巴巴的云计算和大数据的技术布局,以及阿里的商业生态布局,提出了“数据容器”的设想。御膳房架构的思想在于放弃了传统的数据导出模式,将数据加工成数据任务,同时数据加工的结果对接可信应用环境,做到数据可用不可漏。

该架构的核心流程包括伙伴开发、受控容器、授信对接、安全加固四部分。首先合作伙伴在平台上基于样本数据进行开发,所开发的代码提交给平台,平台提供一个不被商家及其合作伙伴接触的受控数据容器,用于提供真实数据计算和处理的场所;此后平台将计算结果对接可信的应用环境,包括集团内部的业务系统和可控应用容器如聚石塔,从根本上解决数据侧漏的问题;此外,该架构还提供数据安全体系用于安全加固,包括代码审核和出口控制,构建多层次的安全保护。

3d6b5ce2659073a04075cede8ff3f8ed03181cb8

御膳房内部分为两个隔离的系统环境,一个是合作伙伴可以接触的数据开发环境,一个是由平台接管完全封闭的数据生产环境。在御膳房中,用户之间相互隔离。如上图所示,在开发环境中提供了用户可触及的样本数据,用户可以基于这些数据开发业务逻辑;生产环境提供的是真实数据,完全由平台控制,开发者是接触不到生产环境的。

御膳房的定位

fb8cfae9ad549d0f21980a97f8e38602a8cc5270

基于上述的探索和架构模式的分析,可以对御膳房平台给出清晰的定位:它的核心价值在于数据赋能,目标是打造集团对外安全的数据加工容器。御膳房的核心抓手是:

  • 数据闭环,安全可控;
  • 商业闭环,互惠互利。

御膳房的基础数据加工能力

ccf52627bf18b34fd48148cd35ca491f237871b4

上图是御膳房提供基础数据加工能力的简单架构图。整个架构分为上下两层,下层是IAAS层,用于提供基础的云设施,如ODPS、RDS;上层是PAAS层,PAAS又分为开发环境和生产环境,该层提供了核心的数据开发工作平台,供商家或者合作伙伴灵活地加工、使用数据。阿里的数据经过抽样、脱敏之后放到IAAS环境中,IAAS环境又分为样本空间和生产空间,用户在PAAS层的开发环境中可以触及样本空间,因此可以完成基于样本数据进行业务逻辑的开发;业务逻辑开发完成后,需要将代码提交给生产环境,数据开发工作台通过工作流调度访问真实数据环境,执行的结果放在生产环境中,数据结果有几种出口,初期的出口是通过导出服务将ODPS的计算结果导入RDS中,RDS通过查询服务,以TOP接口的方式对接聚石塔,完成整个数据消费的可控闭环。

在该过程中,还涉及其他一些模块,如用于提供可视化操作的运维管理、横跨开发环境和生产环境的权限管理和元数据管理等。

ad75f027bd87e3b1d16594675f191a8d80de0fa5

除了基础数据加工能力外,御膳房还提供了简单的安全控制。例如,数据放到IAAS层前需要进行抽样、脱敏,分离出样本集和生产集;其次当合作伙伴或商家开发业务逻辑时,会有一些基于阿里商业的约束,例如当合作伙伴操作授权店铺数据时,要杜绝两种情况的发生:

  1. 能跨卖家进行操作数据;
  2. 不能进行类目或行业的聚合操作。

因此,御膳房的代码审核模块需要自动地对用户的SQL代码进行语义分析,与安全的语义规则进行匹配,进而完成商业规则的审核,如果自动代码审核不通过,则需要人工介入。对于出口控制,御膳房第一期的出口只能对接聚石塔。

3b3e0a8fbcac3148b8cea4478f436c596038bfa8

御膳房在发展过程中也面临着新的需求:DT类的应用与IT类的应用最大的不同是它把数据当做资产,需要对数据进行复杂的探索、剖析和模型试验后,才能决定使用哪些数据,如何使用数据。数据探索、挖掘的实验工具和方法太多,如Python、R studio等,官方很难提供适合所有用户的数据探索产品,因此在御膳房上如何给客户提供数据探索的能力是一个必须要解决的问题;

高阶数据加工,仅仅使用SQL和MR操作数据是远远不够的,需要引入更多数据挖掘的算法包,以帮助用户进行深层次的数据价值挖掘。

御膳房的高阶数据加工能力

05604d57abcbf5094e2b52c14460c7df5b992c02

为了给用户提供数据探索能力,在御膳房中提出了虚拟桌面的架构,在虚拟机上安装常用的数据挖掘工具,如Python、R studio等,让开发者可以进行多种方式的探索工作,同时还获得了安全加固的能力。我们使用Guacamole在VNC Server和浏览器之间建立了一个代理,Guacamole与VNC Server进行通信,就像VNC Viewer和Server之间的通信一样,然后Guacamole再将需要显示的数据传给浏览器用Canvas绘制出来。选择Guacamole的原因是支持定制化(如登陆认证的扩展),与御膳房的租户模型进行对接;

在精准营销场景,很多围绕人的分析都依赖于底层消费者信息的数据,对于这类数据的访问和处理极易引发信息泄露风险;

御膳房提供了人群数据服务,通过数据服务的方式将核心逻辑和底层数据都封装在其中,同时通过前期的脱敏和后期的风控来避免开发者直接接触数据以及推导个体行为的可能。人群数据服务可以简单理解成一个函数,开发者可以指定输入参数,核心逻辑在函数中黑盒完成,同时结果会在风控之后给到开发者,确保敏感数据的安全。在御膳房中,提供了行为/属性圈人、IDMapping、人群放大、人群透视等数据服务。

人群数据服务能够根据用户的设定,进行圈人、透视等操作,但是无法用算法模型进行预测,为了实现人群的建模和预测操作,御膳房推出了海王星(即人群建模预测平台),

底层封装了阿里的海量数据,同时提供了灵活的特征构建和数据挖掘的高阶算法,让用户可视化的完成人群建模、训练、预测的工作流平台,轻松产出用户所关注的个性化定制人群。

 

35e11a59326acd83c9dea1421f8fdd3fb036b1c5

上图是御膳房补充高阶数据加工能力后的架构图。与之前的架构相比,主要的差异包括:开发环境中增加了算法、探索环境;其次,在数据出口,增加了授信业务环境,例如阿里妈妈的DMP、阿里的短信通道、支付宝红包通道等。

御膳房的安全加固

28b038673a05e7137cdcef93175202a92d37d4b4

随着御膳房平台上链路和提供的能力增加,因此数据风险性也随着增加,我们需要确保在每条链路的各环节的数据安全。在数据安全加固过程中有两个关键点:第一,需要对数据进行严格的隐式脱敏与安全分级;第二,对数据的处理全过程进行严格的监控和审计。

4e2083e3633fdff1fd26cbeced8843e9f6b3c5d5

上图是御膳房的数据安全加固模型,该模型主要包括输入安全、处理过程安全、输出安全三个模块,输入安全又包括数据安全分级、合理授权和数据脱敏,确保隐私数据和商业秘密不泄露,同时也能规避一些法律风险:

  • 数据安全分级是对数据进行简单打标,不同安全级别的数据在平台的可透出能力不同;
  • 合理授权是当合作伙伴需要使用商家数据,可以通过订购的方式进行授权;
  • 数据脱敏主要分为两类,第一类是对个人隐私敏感数据进行脱敏或模糊化,第二类是对可能泄露商业秘密的指标进行指数化或离散化。

处理过程安全主要关注代码行为、开发者行为:

  • 代码行为是指开发者提交的代码中的逻辑操作,判断该操作是否有安全风险;
  • 开发者行为是指开发者在平台上的具体操作,这些具体的操作是否合规;
  • 此外,各个组件需要进行针对性的数据安全加固,确保能够感知开发者触发的安全风险。

输出安全包括出口控制和行为监控,输出安全是安全加固的最后一道闸口,需要确保敏感数据的不泄露。

2de5b30411215e53ac2af24facfd532c02a97016

在上图所示的架构中,标红的模块覆盖了所有的关键链路,如PAAS访问IAAS链路、开发和生产交互过、数据出口到授信环境的链路。

在PAAS访问数据时,首先数据需要经过脱敏模块和数据安全定级打标,才能送至PAAS环境中;其次PAAS环境访问时,探索环节提供的是远程图形桌面,避免客户低成本地获取页面上展现的数据。开发环境和生产环境交互过程的核心是自动代码审核,用户的代码逻辑需要和安全规则匹配,此外,还有行为监控,用户在生产环境和开发环境的所有行为都会通过行为监控采集关键信息,自动分析后,对于异常行为告警。

最后,通过出口控制限定数据最终的消费在授信环境中进行。

御膳房精准营销案例

286e4a6d7785bd4e6896292f9c11b0d62c696261

上图是御膳房精准营销案例,用户是广告ISV,首先会上传种子用户,将种子用户当做正样本,通过御膳房提供的ID Mapping 服务和阿里数据进行关联,用户数据匹配之后通过人群画像功能对所关心的标签或属性进行画像;在具体营销前,需要对样本人群进行放大,对于低阶用户,直接使用人群放大服务;对于高阶用户,可以使用海王星人群建模预测平台构建模型进行训练,对更大范围的人群进行预测;放大后的人群营销触达后的效果数据可以回传到御膳房平台上,进行后续的效果分析和进一步迭代优化模型。

72dbb8a1eeb277e2753341970edd87acf26cac91

御膳房的整体安全闭环核心要解决的问题有两个:一是数据不被导出,避免造成潜在商业价值的损失,御膳房的对应策略是给予客户数据弹性加工能力的同时构建数据闭环;第二是消费者的隐私不被侵犯,御膳房与之对应的策略是开发过程中增加严格的数据脱敏工具集。

因此,御膳房的安全闭环由沙箱安全平台和业务安全策略两部分组成,其中业务安全策略是运行在沙箱安全平台中。沙箱安全平台如上图所示,主要包括数据合规工具、代码审核工具、出口控制和智能审计四部分。

业务安全策略包括生态内闭环、阿里内闭环和战略协议闭环。

展望与总结

ac1a0849b826083c5b4acfe10d8b7c6362b3e8ac

展望未来:

  • 在高阶处理阿里数据方面,现在比较局限在使用海王星(即人群建模服务)来满足营销的场景,支持更加广泛的高阶处理数据场景,是未来的一个挑战和方向;
  • 需要解决基于明细数据的灵活分析洞察的安全问题,有可能面临PII(Personally identifiable information)攻击,即通过指向性标签或标签结合背景知识定位到个人,从而泄露用户的隐私,通过目前的脱敏工具不能解决问题,需要探索匿名化技术方向(如K匿名、L-多样性)
  • 整个处理平台支持实时流数据的采集、加工和消费也是一个方向;
  • 通过paas层深度加工数据是有很高门槛的,因此我们希望可以抽象平台的使用场景,封装成业务用,提升用户在特定场景的使用效率,同时降低使用的门槛。

78714515756dadc1cf80e9a7fa9d7141c0c0f94d 

对于商家、ISV来说,御膳房像一个厨房,开发者就像厨师,可以在厨房中用自带和平台提供的数据原材料,加工完成数据大餐。

御膳房的愿景是:通过提供的数据安全容器能够帮助商家及其合作伙伴驾驭数据、驱动未来。


关于分享者:

朱震杰(花名:澄苍),阿里巴巴高级技术专家,大数据处理专家,经历了官方数据产品店铺经和对外数据处理平台御膳房的构建,积累了丰富的大数据实时/离线处理的经验和大数据平台构建的经验。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值