自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(297)
  • 资源 (1)

原创 选择适合你的开源 OLAP 引擎

摘要:本文主要介绍了主流开源的OLAP引擎:Hive、Sparksql、Presto、Kylin、Impala、Druid、Clickhouse 等,逐一介绍了每一款开源 OLAP 引擎,包含架构、优缺点、使用场景等,希望可以给大家有所启发。PS: 文章较长,建议收藏慢慢看。说起 OLAP 要追溯到 1993 年。在1993年,E.F.Codd 及其同事制定了下面这12条规则来定义 了 OLAP准则1 OLAP模型必须提供多维概念视图准则2 透明性准则准则3 存取能力准则准则4 稳定的报表能力

2020-05-13 21:32:38 295

原创 码住!Flink Contributor 速成指南

...

2020-09-29 08:50:00 12

原创 Flink SQL 1.11 新功能与最佳实践

#2020云栖大会#阿里云海量offer来啦!投简历、赢阿里云限量礼品及阿里云ACA认证免费考试资格!>>> ...

2020-09-09 08:31:00 91

原创 如何基于 Flink 生成在线机器学习的样本?

#2020云栖大会#阿里云海量offer来啦!投简历、赢阿里云限量礼品及阿里云ACA认证免费考试资格!>>> ...

2020-09-09 08:31:00 56

原创 Flink SQL CDC 上线!我们总结了 13 条生产实践经验

#2020云栖大会#阿里云海量offer来啦!投简历、赢阿里云限量礼品及阿里云ACA认证免费考试资格!>>> ...

2020-09-09 08:31:00 59

原创 Zeppelin SDK :Flink 平台建设的基石

#2020云栖大会#阿里云海量offer来啦!投简历、赢阿里云限量礼品及阿里云ACA认证免费考试资格!>>> ...

2020-09-03 12:40:00 66

原创 数据处理能力相差 2.4 倍?Flink 使用 RocksDB 和 Gemini 的性能对比实验

行业解决方案、产品招募中!想赚钱就来传!>>> ...

2020-08-05 20:24:00 66

原创 单日课程超10万节!VIPKID 如何通过实时计算提升上课体验?

行业解决方案、产品招募中!想赚钱就来传!>>> ...

2020-08-03 22:32:00 47

原创 Flink x Zeppelin ,Hive Streaming 实战解析

行业解决方案、产品招募中!想赚钱就来传!>>> ...

2020-08-03 22:32:00 83

原创 数仓系列 | 深入解读 Flink 资源管理机制

精选30+云产品,助力企业轻松上云!>>> 整...

2020-07-26 16:09:00 54

原创 Hive 老当益庄 | 深度解读 Flink 1.11:流批一体 Hive 数仓

精选30+云产品,助力企业轻松上云!>>> ...

2020-07-25 19:25:00 144

原创 数仓大法好!跨境电商 Shopee 的实时数仓之路

精选30+云产品,助力企业轻松上云!>>> ...

2020-07-24 06:52:00 62

原创 首次揭秘!​春晚活动下快手实时链路保障实践

精选30+云产品,助力企业轻松上云!>>> ...

2020-07-24 06:52:00 20

原创 PyFlink 在聚美优品的应用实践

精选30+云产品,助力企业轻松上云!>>> ...

2020-07-24 06:52:00 50

原创 高能预警!Apache Flink Meetup · 上海站返场啦

精选30+云产品,助力企业轻松上云!>>> ...

2020-07-23 17:44:00 86

原创 深入分析 Flink SQL 工作机制

精选30+云产品,助力企业轻松上云!>>> ...

2020-07-23 17:44:00 77

原创 深入理解计算机系统视频版,绝对干货

csapp的作者的讲课视频,分享给大家,看视频加上书效果应该不错。B站:https://www.bilibili.com/video/av31289365youtube:https://www.youtube.com/playlist?list=PLmBgoRqEQCWy58EIwLSWwMPfkwLOLRM5R官网:http://www.cs.cmu.edu/afs/cs/academic/class/15213-f16/www/schedule.html字幕github:https://gith

2020-07-20 12:46:00 156

原创 两本电子书 |Flink 最佳学习实践 | 从 0 到 1 学会 Apache Flink

最近接连几天的加班,每次下班基本是晚上 10 点之后了,越发感觉到自己学习的时间并不是很多。所以,要给自己定一个目标,保证一天 2 个小时的学习时间,过程中不被要其他事情打扰而分心。根据我的经验和观察,大部分初学者在选择搜集资料和筛选学习资料的环节会消耗大量的时间,而市场上的充斥着良莠不齐的视频、语音、文字、图片等信息,往往会给初学者带来困扰。“我到底该选择什么版本?哪本书讲的梗更好?”等等,诸如此类的疑问。笔者最近一直在学习 Flink 技术栈,今天给大家分享 2 份不错的学习资料,免费的,但是价值不

2020-07-16 00:57:46 116

原创 Flink 最佳学习实践 | 从 0 到 1 学会 Apache Flink

精选30+云产品,助力企业轻松上云!>>> 最...

2020-07-15 23:58:00 18

原创 groovy 对 list 排序

在groovy中对list排序是很简单的事情。比如:def list=[]list<<[name:"aa",age:1]list<<[name:"bb",age:22]list<<[name:"cc",age:33]list<<[name:"dd",age:2]def newlist=list.sort{a,b-> return a.age-b.age}newlist.each{ println it}打印内容是:[name:

2020-06-24 10:04:06 118

原创 Spark 报错 DROP TABLE IF EXISTS should not show AnalysisException

spark-sql 执行执行 drop table if exists xxxx 的时候,报错信息如下:DROP TABLE IF EXISTS should not show AnalysisException,找不到表xxxx,这里其实是一个bug如图,执行 spark-shell 可以进交互终端,会显示 Spark 的版本,2.2.1问题地址:https://issues.apache.org/jira/browse/SPARK-22686在2.2.2版本开始已经解决。...

2020-06-23 18:42:01 193

原创 大数据平台之初体验 | 网易猛犸 | 数据仓库、调度系统、数据质量、离线与实时计算应有尽有。
原力计划

一句话介绍一站式大数据管理和应用开发平台,具有敏捷易用,成熟稳定,安全可靠,开放灵活的特点。平台架构产品功能1、大规模数据存储与计算支持不同的存储方案和计算方案,灵活满足客户的需求。支持 HDFS、Hbase、Kudu 等从 GB 到 PB 级别的存储方案,支持 Hive 和 MapReduce 等批量计算、Spark 内存计算、Kylin 多维分析、Impala 和流式计算(开源 Spark Streaming 和自研 Sloth)等计算方案,灵活满足客户的各类场景。2、数据集成支持全量

2020-05-26 09:44:20 368

原创 选择适合自己的 OLAP 引擎,干货

摘要:本文主要介绍了主流开源的OLAP引擎:Hive、Sparksql、Presto、Kylin、Impala、Druid、Clickhouse 等,逐一介绍了每一款开源 OLAP 引擎,包含架构、优缺点、使用场景等,希望可以给大家有所启发。PS: 文章较长,建议收藏慢慢看。说起 OLAP 要追溯到 1993 年。OLAP 准则准则1 OLAP模型必须提供多维概念视图准则2 透明性准则准则3 存取能力准则准则4 稳定的报表能力准则5 客户/服务器体系结构准则6 维的等同性准则准则7 .

2020-05-20 10:52:50 285

原创 Hive导数据到本地文件

hive -e "set hive.cli.print.header=true;select * from xxxx.xxxxxx " > xxx.txt如果不需要表头,就设置 set hive.cli.print.header=false 即可。

2020-05-14 14:08:09 135

原创 ROLAP、MOLAP和HOLAP联机分析处理区别

精选30+云产品,助力企业轻松上云!>>> ...

2020-05-13 20:15:00 28

原创 MPP 技术简述,Hadoop 与 MPPDB 的区别

精选30+云产品,助力企业轻松上云!>>> 整...

2020-05-13 20:15:00 135

原创 Spark 性能优化指南(官网文档)

精选30+云产品,助力企业轻松上云!>>> ...

2020-05-12 08:59:00 16

原创 本地Spark连接远程集群Hive(Scala/Python)

精选30+云产品,助力企业轻松上云!>>> ...

2020-05-12 08:59:00 86

原创 2020 年 Flink 最佳学习路线,学习的路上,你,并不孤单

精选30+云产品,助力企业轻松上云!>>> ...

2020-05-10 23:44:00 27

原创 来了来了,2020 首场 Meetup ,可!

精选30+云产品,助力企业轻松上云!>>> ...

2020-05-10 23:44:00 24

原创 精选互联网早报 2020-04-24 | 台积电准备为苹果生产定制的MAC处理器

精选互联网早报 2020-04-24精选互联网早报,每天 8 点准时更新。国家知识产权局:我国国际专利申请量跃居世界第一国务院新闻办公室23日举行新闻发布会,国家知识产权局局长申长雨表示,世界知识产权组织有关报告及数据显示,中国在2019年全球创新指数中的排名提升至第十四位,较2018年上升3位,稳居中等收入经济体首位;2019年,中国通过《专利合作条约》(PCT)途径提交专利申请5...

2020-04-28 10:30:13 3042

原创 关于TCP协议的大部分,面试常问的几点都在这理里了

精选30+云产品,助力企业轻松上云!>>> ...

2020-04-26 22:04:00 40

原创 <大数据> 自学视频资料,纯分享

精选30+云产品,助力企业轻松上云!&gt;&gt;&gt; ...

2020-04-26 22:04:00 9

原创 干货 | ZooKeeper 源码和实践揭秘

精选30+云产品,助力企业轻松上云!&gt;&gt;&gt; ...

2020-04-21 21:21:00 11

原创 【干货】趣头条基于 Flink+ClickHouse 构建实时数据分析平台

精选30+云产品,助力企业轻松上云!&gt;&gt;&gt; ...

2020-04-17 13:25:00 29

原创 Apache Flink新场景——OLAP引擎

最近我们也正打算做OLAP分析平台,在调研的过程中,发现已有的成熟技术只能满足我们的部分需求,相信大家也有这样的困惑,本文分享的是来自阿里巴巴集团的技术专家贺小令分享为什么选择使用 Flink 作为新一代OLAP引擎以及他们是如何优化的。本次分享的主题为Apache Flink新场景——OLAP引擎,主要内容包括:1.背景介绍2.Apache Flink OLAP引擎3.案例介绍4.未来计...

2020-04-16 16:23:56 237

原创 Apache Flink OLAP引擎性能优化及应用

精选30+云产品,助力企业轻松上云!&gt;&gt;&gt; ...

2020-04-16 16:11:00 13

转载 干货 | 有赞数据仓库实践之路

数据仓库怎么学?从混沌期、建设期到成熟期、有赞数据仓库是怎么实践的?一、大数据环境下的有赞数据仓库二、发展历程混沌期 (乱)建设期(数仓分层、主题域划分、权限设计、数据字典、任务等级)成熟期(维度建模VS宽表、重新设计DW分层、命名规范、计算引擎进化)三、有赞数仓还在进化消除重复计算数仓的价值原文地址:戳↓https://mp.weixin.qq.com/s/wlhZ...

2020-04-03 19:15:44 99

原创 趣头条基于 Flink+ClickHouse 构建实时数据分析平台

精选30+云产品,助力企业轻松上云!&gt;&gt;&gt; ...

2020-04-02 23:45:00 62

原创 深入理解 MySQL 索引底层原理

精选30+云产品,助力企业轻松上云!&gt;&gt;&gt; ...

2020-03-17 10:32:00 10

hive 优化思维导图

hive 优化在面试以及工作中经常使用,我整理了一份思维导图供大家学习。

2018-11-30

空空如也

空空如也
提示
确定要删除当前文章?
取消 删除