京东用了哪些大数据平台产品体系?

本文介绍了京东大数据平台的发展历程,包括调度平台的3.0版本、数据集成开发平台、数据知识管理平台、京东分析师、数据挖掘平台和数据质量监控平台,阐述了各平台的功能和对大数据处理的重要性。调度平台通过不断迭代提升了稳定性与自动化水平,数据集成开发平台简化了数据提取过程,数据知识管理平台和数据质量监控平台则分别实现了元数据管理和数据质量保障。
摘要由CSDN通过智能技术生成

对于京东大数据平台来说,数据产品并不是一个新鲜事物,2011年自建数据仓库上线的同时,第一款数据产品调度平台也一同上线并正式投入使用。

调度平台

订单交易,仓储物流等众多京东系统都会产生数据,仅日志内容每天的大小约为1TB,大量的数据如何统一汇总到数据仓库来呢?这就需要调度产品来实现数据生产。京东调度平台发展至今已经是3.0版本,每一次的更新迭代都凝聚着京东大数据平台开发工程师许许多多个日夜的心血,也是我们技术突破与功能升级的具体体现。

调度平台1.0版本架构

1.0版本于2011年8月上线,一台服务器作为中心节点指挥调度,另外3台服务器负责相关数据作业,任务之间通过后置变量的方式设定前后依赖关系,调度机制便运行起来了。数据仓库建立之初的任务并不太多,数据量没有太过庞大,数据ETL过程所需计算资源也都完全应付得来。

但随着仓库收纳数据的增加,数据生产任务越来越多,任务之间的依赖关系也变得越来越复杂。每个BI工程师需要根据自己的生产任务设定后置变量的值以建立任务依赖关系,任务多了之后不但设置起来耗时费力且不易管理,当一个人的任务需要重跑时后置变量的修改可能会影响到别人的任务。

2.0版本上线了新的调度引擎,彻底解决了这个问题。新任务上线只需要选择依赖的父任务即可建立关系,且流程独立,不会因同一个任务被多个依赖而造成干扰。除此之外,任务可视化配置与浏览功能也在这个版本上线,任务运行状

  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值