滴滴出行的数据架构和信息流处理思路解析

640?wx_fmt=png

截止到今年7月,滴滴注册用户已超过5.5亿,年运送乘客达100亿人次,每日处理数据4875+TB,日定位数超过150亿,每日路径规划请求超过400亿次。

      面对庞大的数据量,滴滴的实时计算、数据存储和数据清洗都基本做到了行业典范。下面我们来了解一下滴滴的数据库框架设计。

640?wx_fmt=png

此外,滴滴的信息流处理流程也是值得我们借鉴的。

640?wx_fmt=png
640?wx_fmt=gif
640?wx_fmt=png
640?wx_fmt=gif
640?wx_fmt=gif
640?wx_fmt=png
640?wx_fmt=gif
640?wx_fmt=png

接下来我们来了解一下智慧出行的

底层数据项目架构及解决方案概述

1、通过binlog方式实时梳理业务库高QPS压力2、内置源码模块,细粒度监控Spark作业,失败及时邮件报警

3、覆盖源码自定义数据源加载,从源头进行列剪枝

4、自定义维护Kafka的偏移量管理,实现exactlyonce

5、实现前后端rest接口的开发规范

      关于项目模块搭建的部分,前后端模块是分离的:后台使用一套环境,前端按照系统分开两个WEB项目(一个是订单数据监控系统,一个是出行数据运营系统)进行数据展示。

      关于项目平台搭建(Cloudera),分为以下三部分:

1、Cloudera的服务搭建

2、Cloudera的Hadoop生态搭建

3、Cloudera的分布式消息系统搭建 

      关于业务库高并发解决方案介绍和架构实现,以及项目common模块的开发实现,这里有一份滴滴出行人才培养计划的课程大纲。课程里结合了很多滴滴智能出行场景,也结合了滴滴用来培养大数据方向人才的逻辑。

     建议大家仔细阅读一下,同时也可以学习一下滴滴处理一些数据业务时应用的技术!

课程大纲(向下滑动查看)

向下滑动阅览

640?wx_fmt=png
640?wx_fmt=png
640?wx_fmt=png
640?wx_fmt=png
640?wx_fmt=png

     课程将严格遵守滴滴出行的数据安全标准,本培养计划中订单、车辆分布和收入总数等数据均采用模拟数据集实现,此类功能点在大纲中用*标注。

因为滴滴大数据人才培养计划今年只招收199人,所以要对学员进行筛选,满足以下条件的学员可以扫描二维码报名参与选拔!

  • 有两年以上Java编程经验;

  • 有一定的大数据技术与分布式系统的理论基础;

  • 有较强的思维逻辑能力,能应对复杂业务场景处理。

  扫描下方二维码预报名

参与“大厂人才培养计划”考核  

640?wx_fmt=png

参加过培养计划的学员将收获

640?wx_fmt=png

大厂就业绿色通道

     滴滴出行人才培养计划是与后厂理工学院合作的,也旨在筛选和培养出更具有实战能力的数据工程师。而Boss直聘、拉勾网、智联招聘等多家就业招聘企业同后厂理工学院达成合作,为毕业生提供优先推荐服务,绝不让薪资就业成为难住学员的问题。

640?wx_fmt=jpeg

Boss直聘创始人、CEO赵鹏宣布为学员提供优先推荐

试点课程部分学员就业去向,就业率达80%

640?wx_fmt=png
640?wx_fmt=png

提供导师直播+录播留存+线上实训+班主任督导,更有教师团队在线答疑、实践作业批改反馈以及项目小组竞技PK

640?wx_fmt=png

学员修满学分毕业后将获得后厂理工学院与滴滴出行联合颁发的结业证书,一线大厂认可,学习记录及成绩永久可查

入学学费

640?wx_fmt=png

   本期资深大数据工程师培养计划仅招生199人,报满即止!

  扫描下方二维码预报名

参与“大厂人才培养计划”考核  

640?wx_fmt=png

640?wx_fmt=png
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
滴滴出行作为全球最大的移动出行平台,每天收集和需要分析处理数据量非常大。这些数据形式多样:既包括存储于数据库中的业务数据,也包括各种API请求所记录的文本日志。此外,更大的挑战在于业务上需要我们实时的分析处理如此大规模的数据。从数据生成到可被分析查询,系统延迟在秒级。我们选用Druid/Samza/Kafka/Spark/Hadoop等开源技术栈,开发了符合Lambda architecture的OLAP系统。本次演讲我们以滴滴数据实时监控系统为例,介绍滴滴实时计算系统架构所面临的挑战及相应解决方案。 滴滴数据实时监控系统服务于滴滴各个业务线,对关键业务指标的变化进行实时监控。研发、产品、运营人员可以据此及时了解业务现状,发现系统问题、调整业务决策。 演讲主要包括以下话题: 1. 实时计算的挑战及解决方案: (1)可扩展性 (2)有状态的实时计算 (3)数据被重复处理 (4)高可用 (5)实时数据流与外部系统或服务关联计算 2. OLAP系统架构选型:KV store与column store 哪种存储更适合OLAP应用? 3. 简要介绍Kafka的特性,阐述为何Kafka是实时计算系统中理想的数据存储方案 4. 详细介绍Druid的架构设计及原理,阐述Druid作为OLAP解决方案的优点 5. 详细介绍Samza的架构设计及原理,阐述如何通过Samza解决实时计算中的各种挑战 6. 介绍Lambda architecture,阐述如何将离线计算和实时计算统一起来,通过离线计算来修正实时计算

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值