![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
30分钟概览新技术
文章平均质量分 89
xwc35047
时间有限,但做于自己的无限。(公众号:水木之椿)
展开
-
浅谈对数据中台理解
背景跟同学朋友聊天的时候会被问到什么是数据中台,这个概念从阿里提出并实践已经有4年左右,但这个概念今年是真正在互联网圈内流行,很多人都听说这个概念,但它到底是什么,有什么用,可以用在哪些场景却很模糊,这里聊聊个人的理解。数据中台是什么?数据中台是马云在参观supercell公司后提出的理念,即大中台小前台,大中台是通用基础技术能力,小前台是指更灵活多样的领域业务。通过强大的中台能力就可以赋...原创 2019-11-13 00:14:48 · 2725 阅读 · 2 评论 -
30分钟概览Spark分布式计算引擎
Spark入门30分钟概览1、为什么出现Spark?2、Spark核心是什么?3、Spark怎么进行分布式计算?4、Spark在互联网公司的实践应用?原创 2017-03-04 16:19:38 · 21708 阅读 · 3 评论 -
30分钟入门DSL工具Antlr4——概念、案例
本文主要面向初学者介绍Antlr4,一款常用语词法语法解析器生成的第三方工具包。全文主要回答几个问题:1、antlr的是什么?2、antlr的功能有哪些,如何使用?3、在公司中使用antlr案例?不知道各位是如何关注到antlr,笔者是因为硕士阶段与中兴合作的一个项目中需要写SQL解析器才渐渐了解到它。后来发现它在大数据中非常实用,尤其在SQL方面。Terence Parr的The Defi原创 2017-03-07 21:49:50 · 9245 阅读 · 0 评论 -
dr.elephant 环境搭建及使用详解
Dr.elephant是一款对Hadoop和Spark任务进行性能监控和调优的工具,它由LinkedIn的团队于2016年开源,开源之前已经在公司运行使用2年。目前使用Dr.elephant的公司国内的有Didi,国外的有airbnb、inmobi、hulu、FourSquare和PayPal等等。 项目地址:https://github.com/linkedin/dr-elephant笔者所在公原创 2017-06-23 12:27:56 · 10178 阅读 · 7 评论 -
30分钟概览Spark Streaming 实时计算
本文主要介绍四个问题:什么是Spark Streaming实时计算?Spark实时计算原理流程是什么?Spark 2.X下一代实时计算框架Structured StreamingSpark Streaming相对其他实时计算框架该如何技术选型?本文主要针对初学者,如果有不明白的概念可了解之前的博客内容。1、什么是Spark Streaming?与其他大数据框架Storm、Flink一样,S原创 2017-02-18 17:12:49 · 26810 阅读 · 4 评论 -
30分钟概览OLAP——起源,概念及现状
本文主要面对OLAP入门同学,读者可以对OLAP起源、核心概念和当前发展趋势有一定理解。OLAP起源OLAP(Online analytical processing),即联机分析处理,主要用于支持企业决策管理分析。这个概念最初源于1962年Kenneth Iverson发表的名为“A Programming Language” (APL)的著作,它第一次提出了处理操作和多维变量的的数学表达式...原创 2019-01-12 22:36:59 · 54626 阅读 · 3 评论