数据中台(读书笔记)-6-数据服务

数据服务就是把数据变为一种服务能力,通过数据服务让数据参与到业务之中,激活整个数据中台,这也是数据中台的价值所在。

数据服务是对数据进行计算逻辑的封装(过滤条件、多维分析和算法推理等计算逻辑),生成API,上层数据应用可以对接数据服务API,让数据快速的应用到业务场景中。

按照数据和计算逻辑的封装不同,数据服务可以分为以下三类:

  • 数据基础服务:面向的对象是物理表数据,主要场景有数据查询、多维分析等,通过自定义SQL的方式实现数据中台全域物理表的指标获取和分析。
  • 标签画像服务:面向的对象是标签数据,主要场景有标签圈人、画像分析等,通过界面配置的方式实现数据中台全域标签数据跨计算、存储的统一查询分析,加快数据应用的开发速度。
  • 算法模型服务:面向的对象是算法模型,主要场景有智能营销、个性化推荐和金融风控等,主要通过界面配置的方式将算法模型一键部署在在线API,支撑智能应用业务。

根据使用场景的不同,可以抽象出很多类型的服务包括:查询服务、分析服务、检索服务、圈人服务、推荐服务、风控服务等等。通常我们用的有这几种查询服务、分析服务、推荐服务、圈人服务

(1)查询服务

 【三个特征】

   a.可以根据查询标识快速查询

   b.可以添加过滤项实现查询数据筛选功能

   c.支持返回结构的分页和排序功能。

 【实现过程】

   step1:数据接入 - 通过数据库连接或者API把数据连接进来

   step2:数据查询 - 通过传参或者图形化界面惊醒查询配置。一般设置查询标识和过滤条件。

   step3:结果规则配置 - 对查询的结果进行排序和分页等。

   step4:能力开放 - 查询的结果生成一个API供上层应用调用。

(2)分析服务

分析服务就是对各种数据进行统计分析的方法,对数据进行任意维度的数据分析挖掘,以支持数据化运营、分析决策等场景。常见的如BI工具等。

【四个特征】

   a.支持多数据源接入,支持Hive、ES、Greenplum、Clickhouse等

   b.高性能继续分析查询,要求服务内置高速计算引擎,实现亿级数据毫秒级分析和计算,减少用户等待时间。

   c.多维数据分析,除了支持常规的数据分析、上卷下钻、切片切块,还要支持多维度的数据分析和数据挖掘,发现数据背后的关联关系。

  d.灵活对接业务系统,分析服务提供包括接口URL、后端数据类型、接口请求模式等多个配置项,最大限度的满足需求。

 【实现过程】

step1:数据接入 - 通过数据库连接或者API把数据连接进来

step2:在线建模 - 本质上就是构建SQL的过程,在这个过程中通常会提供两种方式:1.SQL代码编辑器(面向编程人员) 2.图形化界面(面向业务人员)

step3:能力开放 - 自动生成API对外开放,注意要加权限管控。

(3)推荐服务

推荐服务既所谓的千人千面,对于不同的人对物的行为进行数据挖掘、构建人和物之间的关联关系,来推荐人、物以满足用户的兴趣爱好,以提升用户对业务的黏性。每个人打开淘宝看到的内容不一样这就是基于人的兴趣偏好的推荐服务能力。

【三个特征】

a.支持不同行业的推荐 - 电商行业、直播行业、内容资讯等

b.支持不同场景的推荐 - 同一个行业中对于推荐的使用也存在不同的场景。

c.支持推荐效果优化 - 推荐的终极目标就是成为用户的贴心管家。不需要用户的思考就推荐出用户想要的物品和资讯。

 【实现过程】

step1:数据接入 - 选择行业和场景模板(产品经理角度出发整理)

step2:数据接入 - 这里只原始数据接入,通常接入的分三类。一类是用户相关的数据,二类是物品相关的数据,三类是关系类数据(用户和物品发生关系的数据)。

step3:参数设置 - 通过参数设置可以便捷的配置推荐的模型结构、样本指向、目标设定、输入输出格式等参数,推荐模型既会在设定的参数下开始自动化训练运行,直到模型稳定下来后,产出推荐结果或稳定的推荐模型。

step4:能力开放 - 通过模型训练之后产生一个可以调用的推荐API,该API支持传入ID参数,实时和离线计算之后,将适配该行业或场景下的推荐数据输出返回到相应的上层应用系统中去。

step5:数据回流 - 上层使用推荐服务提供的数据,产生的效果数据回流到推荐模型,通过不断的修正推荐模型,大大提高推荐的准确度。 

(4)圈人服务

各行各业都设计到广告营销,如何找到对的人推广广告成了大数据场景要解决的问题,圈人服务应运而生,通过人群圈选服务,通过API的刑事对接应用上层的营销系统,从而实现营销服务精确触达。

【三个特征】

(1)支持人群圈选

圈人服务的核心就是人群圈选,通过SQL代码或者标签取值组合方式实现人群查找,帮助用户找到对的人群。

(2)支持人群计量

圈人之后还要考虑是否符合预期。如果过于预期要追加条件,选出更精准的人群;如果少于预期,建议放宽筛选条件,或者继续圈选其他合适的人群。

(3)支持多渠道对接

确认人群名单之后,需要将人群名单导出到下游系统。最简单的就是导出文件,再有业务人员导入到业务系统中。

【实现过程】

step1:数据接入 - 通过数据库连接或者API把数据连接进来

step2:人群圈选 - 1.SQL代码编辑器(面向编程人员) 2.图形化界面(面向业务人员)

step3:能力开放 - 和其他服务一样,通过API向上层应用提供。


常见应用

常见的三种应用:

a.数据大屏

b.数据报表

c.智能应用-圈人服务

 

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值