kylin
文章平均质量分 92
kylin系列文章
浪尖聊大数据-浪尖
弓重好:浪尖聊大数据,主要分享大数据架构基础到入门的文章。
展开
-
干货,OLAP数仓从百万到百亿级数据量实时分析
一、有哪些类型的OLAP数仓?1.按数据量划分对一件事物或一个东西基于不同角度,可以进行多种分类方式。对数仓产品也一样。比如我们可以基于数据量来选择不同类型的数量,如下图所示:本系列文章...转载 2021-01-16 16:22:31 · 657 阅读 · 0 评论 -
每个大数据工程师都应该知道的OLAP 核心知识点
OLAP 系统广泛应用于 BI, Reporting, Ad-hoc, ETL 数仓分析等场景,本文主要从体系化的角度来分析 OLAP 系统的核心技术点,从业界已有的 OLAP 中萃取其...转载 2021-01-03 11:56:57 · 485 阅读 · 0 评论 -
一文深入掌握druid
一个用于实时分析的开源数据存储摘要Druid是专用于基于大数据集的实时探索分析的开源数据存储。该系统包括列式存储,分布式的无共享架构,高级索引结构,可用于任意探索具有次秒级延迟的十亿行级...转载 2020-12-29 08:30:00 · 469 阅读 · 0 评论 -
大数据OLAP系统(2)——开源组件篇
转自:https://www.jianshu.com/p/4b3bcbabad77开源大数据OLAP组件,可以分为MOLAP和ROLAP两类。ROLAP中又可细分为MPP数据库和SQL引...转载 2020-12-22 08:30:00 · 756 阅读 · 0 评论 -
阿里巴巴为什么能抗住90秒100亿?看完这篇你就明白了!
作者:huashiou链接:https://segmentfault.com/a/11900000186261631、概述本文以淘宝作为例子,介绍从一百个并发到千万级并发情况下服务端的架...转载 2020-11-28 12:00:00 · 217 阅读 · 0 评论 -
Apache Doris在京东广告的应用实践
1、序言本文主要介绍Apache Doris在京东广告报表查询场景下的应用。文章将从我们原有系统开始讲述,包括我们遇到的问题,面临的挑战,以及我们为何选择使用Apache Doris。最...转载 2020-10-30 08:20:00 · 240 阅读 · 1 评论 -
从数仓到数据中台,谈技术选型最优解
本文根据颜博老师在〖Deeplus直播第218期〗线上分享演讲内容整理而成。(文末有获取本期PPT&回放的途径,不要错过)颜博马蜂窝数仓研发总监现任马蜂窝数据仓库团队负责人,曾供...转载 2020-05-06 00:21:32 · 711 阅读 · 0 评论 -
大数据平台架构设计探究
近年来,随着IT技术与大数据、机器学习、算法方向的不断发展,越来越多的企业都意识到了数据存在的价值,将数据作为自身宝贵的资产进行管理,利用大数据和机器学习能力去挖掘、识别、利用数据资产。...转载 2020-01-05 22:08:42 · 663 阅读 · 0 评论 -
中间件运维分析中的选型与实践
在近期的 Kylin Data Summit 上,好买财富平台架构总监王晔倞在互联网专场上分享了好买财富在中间件运维分析平台的演进过程。好买财富为什么选择从广泛应用的 E...转载 2019-09-04 23:30:40 · 374 阅读 · 0 评论 -
Hbase、Kudu和ClickHouse全视角对比
Hbase、Kudu和ClickHouse横向对比V2.0前言Hadoop生态圈的技术繁多。HDFS一直用来保存底层数据,地位牢固。Hbase作为一款Nosql也是Hadoop生态圈的核心...转载 2021-02-18 17:40:31 · 361 阅读 · 0 评论 -
浅淡 Apache Kylin 与 ClickHouse 的对比
作者简介 周耀,Kyligence 解决方案架构师,Apache Kylin、Apache Superset Contributor。Apache Kylin 和 ClickHouse ...转载 2021-01-14 09:00:00 · 478 阅读 · 0 评论 -
Kylin 大数据下的OLAP解决方案和行业典型应用
最近工作中应用到了 Kylin,因此调研了 Kylin的原理和行业应用。本文参考了官网和众多其他公司中 Kylin的应用案例,文末给出了出处,希望对大家有帮助。Apache Kylin的...转载 2020-12-25 09:32:21 · 210 阅读 · 0 评论 -
Apache Kylin 在中通快递的实践
摘要·Apache Kylin 在中通是如何落地的,又是怎样赋能中通快递实现 OLAP 分析能力起飞的?本文从多方面对比了 Presto 和 Kylin 的优缺点,并从业务场景、调度...转载 2020-11-15 22:06:00 · 314 阅读 · 0 评论 -
Kylin、Druid、ClickHouse核心技术对比
文章作者:吴建超内容来源:jackywoo.cn出品平台:DataFunTalk导读:Kylin、Druid、ClickHouse是目前主流的OLAP引擎,本文尝试从数据模型和索引结构两...转载 2020-11-05 17:32:00 · 677 阅读 · 0 评论 -
美团外卖离线数仓建设实践
文章作者:惠明美团外卖 技术专家编辑整理:史士博出品平台:DataFunTalk导读:美团外卖数据仓库主要是收集各种用户终端业务、行为数据,通过统一口径加工处理,通过多种数据服务支撑主...转载 2020-09-29 20:54:57 · 1809 阅读 · 0 评论 -
Kylin 最佳实践|爱奇艺如何处理千亿级数据
1. 使用 Kylin 的缘由爱奇艺 OLAP 服务演变爱奇艺大数据 OLAP 服务演变的过程可以用如下架构图说明:数据处理流程分为如下几个层级:最下方是采集平台,收集业务的埋点和日志;...转载 2020-08-11 22:59:10 · 431 阅读 · 1 评论 -
Kylin Flink Cube 引擎的前世今生
Apache Kylin™ 是一个开源的、分布式的分析型数据仓库,提供Hadoop/Spark 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,它能在亚秒内查询巨大...转载 2020-07-24 22:51:59 · 296 阅读 · 0 评论 -
汽车之家4 年 Kylin最佳实践大揭秘!
Kylin 作为汽车之家的核心 OLAP 引擎,服务于多个业务线与商业数据产品,应用于流量、线索、用户行为、推荐效果等方面的数据分析场景。目前已有 500+ 个 Kylin Cube,存...转载 2020-06-11 00:00:58 · 505 阅读 · 0 评论 -
吃狗粮:用 Kylin 实时分析 Kylin 运行时指标
通过将 System Cube 的 sink 设置为 Kafka,可以一键提升 System Cube 的易用性和实时性,并且实现 Kylin Metrics 系统的功能闭环。01背景在...转载 2020-05-25 00:01:03 · 863 阅读 · 0 评论 -
滴滴 3000+ Kylin Cube 背后的实践经验揭秘
本次分享主要有三个部分:Kylin 在滴滴的整体应用、架构的实践经验、滴滴全局字典最新版本的实现以及 Kylin 最新实时 OLAP 探索经验分享。Kylin 在滴滴的应用&架构...转载 2020-04-26 00:03:25 · 591 阅读 · 0 评论 -
【开发实践】美团为什么开发 Kylin On Druid(上)?
前言在大数据分析领域,Apache Kylin 和 Apache Druid (incubating) 是两个普遍使用的 OLAP 引擎,都具有支持在超大数据上进行快速查询的能力。在一...转载 2020-04-11 23:17:31 · 352 阅读 · 0 评论 -
【开发实践】美团为什么开发 Kylin On Druid(下)?
前言在上篇文章里,我们比较了 Kylin 和 Druid 这两个重要的 OLAP引擎的特点,也分析了 Kylin on HBase 的不足,得出了使用 Druid 代替 HBase 作...转载 2020-04-11 23:17:31 · 195 阅读 · 0 评论 -
在 Kylin 中实现异常值检测 UD(A)F
本文讲解了时间序列数据异常值检测的基本概念和在 Kylin 中开发使用异常值检测 UDF 的方法,可以作为其他 UDF 开发的参考。通过在 Kylin 中移植 Hivemall 的 UD...转载 2019-12-18 20:23:21 · 489 阅读 · 0 评论 -
Apache Kylin在绿城客户画像系统中的实践
前言作为国内知名的房地产开发商,绿城经过24年的发展,已为全国25万户、80万人营造了美丽家园,并将以“理想生活综合服务提供商”为目标,持续为客户营造高品质的房产品和生活...转载 2018-04-28 00:00:00 · 485 阅读 · 0 评论 -
kylin集群Nginx负载均衡
Nginx负载均衡1, Nginx负载均衡简介跨多个应用程序实例的负载平衡是优化资源利用率,最大化吞吐量,减少延迟以及确保容错配置的常用技术。可以使用nginx作为非常高效的HTTP负载均衡器,将流量分配给多个应用程序服务器,并通过nginx提高Web应用程序的性能,可伸缩性和可靠性。2, Nginx负载均衡机制nginx支持以下负载均衡机制(或方法):循环 - 对应用程序服务器的请求以循环方式分转载 2017-12-13 00:00:00 · 2904 阅读 · 1 评论