nsoutlineview 搜索_阿里巴巴搜索推荐广告三位一体的在线服务体系

最近在工作中大量使用到了淘系的在线分发服务体系,可以快速高效的实现个性化内容分发,其技术架构的概览在这里分享给大家。

AI·OS(Artificial Intelligence Online Serving)是阿里巴巴集个性化搜索、推荐、广告三位一体的在线服务平台。在大型互联网公司里,使用一套技术来支撑搜索、推荐乃至广告是比较少见的。之所以能成为统一的AI·OS体系,是因为阿里巴巴把搜索、推荐、信息流、广告、深度学习这几项,从技术到业务场景都不同的东西,非常好地结合到了一起,得以形成了有实质内涵,能相互借助合体发力的基础引擎平台。

阿里的平台技术战略,本质上是两样东西,一是电商技术(包括商品管理、类目管理、运营管理、交易链路),另一个是和电商配合的大数据 AI 技术的应用。在当今时代,AI的投放、搜索推荐,甚至广告的投放,已经是独立于传统电商的技术场景。

纵观整个业务场景,可以做如下划分:

0609277f-8f19-eb11-8da9-e4434bdf6706.png

对于技术层面的划分,由上至下分为三层:

  • 分布式引擎系统需要具备的能力。无论是搜索、推荐、广告,都需要召回、排序,系统做大之后,需要分布式通信,高性能索引的存储,要有比较高效率的支持索引灵活构建更新的能力,以上是基础能力。

  • 深度学习时代沉淀出来的技术要求和场景要求。比如深度学习需要做样本处理,做训练,在线预测,同时,与之相应的,是个性化投放,这在搜索、推荐、广告都有所体现。最后,索引的部分还应该支持实时更新

  • 整个体系内有资源管理,高可用性,相应的计算引擎的支撑,运维的管控和插件的支持。

AI·OS 工程体系技术

0909277f-8f19-eb11-8da9-e4434bdf6706.png

在这个组件的最下层是资源的管理,叫 Hippo,是一个非常高效的资源管理系统。

右侧是系统里的中间件,是更为基础的组件,跟实际的业务功能都直接相关。

左侧的算法平台、离线平台、训练平台、计算平台,是在深度学习时代新的开拓。星云是面向大规模商业化场景的一站式深度学习建模平台。借助星云,用户可以快速完成从特征引入、样本特征变换,到模型训练及评估,再到模型交付整个算法建模闭环。在此基础上,星云提供了完善的数据模型校验体系,确保用户的离线建模和模型交付具备生产级别的可靠性。星云支持全量学习、增量学习和在线学习,并通过高层抽 象实现了各种学习模式之间的低成本切换。XDL是以开源框架为基础,面向广告、搜索、推荐等场景打造的分布式深度学习框架,针对高维稀疏特征、互联网结构化数据和结构化模型进行了专门设计与优化。

中间在线服务和业务密切相关。HA3 搜索引擎的服务是阿里云最经典的具有全文本检索能力的引擎。商业化引擎,是与 HA3 相对应的,支持广告业务、关键词匹配带广告,或者支持定向场景投放的召回引擎。iGraph 图引擎,是具备在线图计算和图检索能力,在业界规模较大的图检索引擎,它里面具备的用户个性化关系、知识图谱的在线推导能力都是很大规模的。这些引擎都是支持数据实时更新的,这个能力的来源就是AI·OS Framework,支持对数据的管理,对更新的管理,是对右侧整套技术的依赖,也有延伸出来的深度学习的能力。预测引擎 RTP,把 TensorFlow 的能力集成进来,让深度大模型支持实时更新,充分利用实时数据分布,提升 CTR/CVR 预估精度,获取业务效果。模型特征支持实时更新,模型可以增量训练,通过对 RTP 在线 graph 分解,提取可更新模型 weights 成最大不连通可执行子图,实时发送模型数据消息,真正实现了模型离线流式训练,在线实时更新的效果。TPP(The Personalization Platform,阿里个性化平台)为集团众多的个性化业务提供开放、一致的解决方案,让搜索、推荐技术轻松服务于业务发展,业务也能快速得在平台找到需要的技术,是 AI·OS(Online Serving)大数据深度学习在线服务体系中的入口之一。

在线服务技术架构演进

AI·OS 在线服务架构,对逐步走向规模化的初创公司,具备一定的参考意义。

0a09277f-8f19-eb11-8da9-e4434bdf6706.png

  • 在 2013 年至 2015 年期间主要在搜索引擎上做性能优化,在阿里体系内部做搜索引擎平台化。搜索搭建主要是运用比较经典的架构——Query 的处理+搜索引擎+摘要服务,Query 的部分,会有一些个性化存储,当时是用简单的 KV 来完成。这个架构是很多初创型企业选用的架构,也是云产品提供的一个经典解决方案。

  • 2015 年到 2018 年,随着信息流业务的进入,将搜索底层(Suez 或 AI·OS framework)数据抽象沉淀出来,在沉淀的数据上面,衍生了图引擎、预测引擎、搜索引擎、推荐引擎,形成了今天 AI·OS 的主体框架。

  • 2018 年~2019 年,推进了全图化的架构。在业务逻辑调整、场景迭代、功能调整,如粗排、精排、统计、过滤这些功能,都用图化的方式来表达,在业务迭代效率上,有了质的飞越。

  • 随着集团内部进一步贯彻中台战略,不管是在软件的抽象,还是在能力的衍生,都需要在云上发挥。践行平台化、通用化的思路,用最高效的方式解决问题,并打造出了海神(一站式选品投放系统)、开放搜索(一站式内容智能搜索服务)等经典应用产品。

AI·OS 云原生产品与实践

依托于 AI·OS 体系构建的产品矩阵如下所示。

0b09277f-8f19-eb11-8da9-e4434bdf6706.png

  • 开放搜索(OpenSearch)源于阿里巴巴 AI·OS 体系技术,是免运维、一键式的云上平台,将搜索平台服务化、产品化,完全屏蔽了搜索系统的底层复杂度,以标准化产品的方式支持业务。

    0c09277f-8f19-eb11-8da9-e4434bdf6706.png

  • 智能推荐(AIRec)提供一站式的个性化推荐服务,服务使用者在提交内容和用户行为,在确保数据保密的前提下,按照不同行业的模板,应用个性化推荐算法,实时调整效果,为用户提供服务。

    0f09277f-8f19-eb11-8da9-e4434bdf6706.png

  • 还有围绕开源生态的 Elasticsearch,由阿里巴巴和 Elastic 公司合作推出。将 Elasticsearch 的灵活易用和阿里巴巴调度管控系统的稳定高效相结合,并根据用户需求,不断迭代自研的创新性功能.

在后续文章,我将通过展示这些系统的具体使用方法,欢迎大家关注。

[1]淘系千人千面分发体系全拆解 https://developer.aliyun.com/topic/download?spm=a2c6h.12873639.0.0.a7253263pFVo5c&id=8619&Signature=nqC%2Fc8BvldkxgJ21cQBlOgQe7Kk%3D

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值