druid
大树叶
宠辱不惊,看庭前花开花落;去留无意,望天空云卷云舒。
展开
-
druid 单机版启动
有时候,需要把druid 所有部署到一台主机上,那如何启动?cd druid安装目录,然后./bin/supervise -c quickstart/tutorial/conf/tutorial-cluster.conf > ./mylog.log &这个命令的好处就是在本机上启动所有的服务。而且如果一个服务挂了,它会自动重启该服务的!另外通过bin/service...原创 2019-10-25 11:57:42 · 824 阅读 · 0 评论 -
Druid.io系列6:问题总结
我们在生产环境中使用Druid也遇到了很多问题,通过阅读官网文档、源码以及社区提问解决或部分解决了很多问题,现将遇到的问题、解决方案以及调优经验总结如下:问题一:Hadoop batch ingestion失败,日志错误为“No buckets?…“解决方案:这个问题当初困扰了我们大概一周的时间,对于大部分刚接触Druid人来说基本都会遇到时区问题。其实问题很简单,主要在于集群工作时区与导入数据时...原创 2018-04-30 23:56:19 · 1874 阅读 · 0 评论 -
Druid.io系列2:概念与架构
在介绍Druid架构之前,我们先结合有关OLAP的基本原理来理解Druid中的一些基本概念。1 数据 以图3.1为例,结合我们在第一章中介绍的OLAP基本概念,按列的类型上述数据可以分成以下三类:时间序列(Timestamp),Druid既是内存数据库,又是时间序列数据库,Druid中所有查询以及索引过程都和时间维度息息相关。Druid底层使用绝对毫秒数保存时间戳,默认使用ISO-8601格式展示...转载 2018-04-30 23:59:07 · 313 阅读 · 0 评论 -
Druid.io系列1:背景简介
Druid.io(以下简称Druid)是面向海量数据的、用于实时查询与分析的OLAP存储系统。Druid的四大关键特性总结如下:亚秒级的OLAP查询分析。Druid采用了列式存储、倒排索引、位图索引等关键技术,能够在亚秒级别内完成海量数据的过滤、聚合以及多维分析等操作。实时流数据分析。区别于传统分析型数据库采用的批量导入数据进行分析的方式,Druid提供了实时流数据分析,采用LSM(Long st...转载 2018-05-01 00:01:12 · 1478 阅读 · 0 评论 -
驱动海量大数据实时多维分析,优酷为什么会选择Druid?
http://www.raincent.com/content-85-7091-3.html原创 2018-04-25 01:42:14 · 708 阅读 · 0 评论 -
Druid中Segements保留和自动删除规则配置
中文内容:http://www.openskill.cn/article/473具体内容,参考官网:http://druid.io/docs/latest/operations/rule-configuration.html转载 2018-05-13 23:58:39 · 880 阅读 · 0 评论 -
Druid 技术白皮书:大数据实时统计分析数据存储
官方文档:druid技术白皮书(点击这里) Druid 是一个为在大数据集之上做实时统计分析而设计的开源数据存储。这个系统集合了一个面向列存储的层,一个分布式、shared-nothing的架构,和一个高级的索引结构,来达成在秒级以内对十亿行级别的表进行任意的探索分析。在这篇论文里面,我们会描述Druid的架构,和怎样支持快速聚合、灵活的过滤、和低延迟数据导入的一些细节。1. 介绍...原创 2019-02-16 10:31:42 · 2963 阅读 · 0 评论 -
[推荐 ]druid 架构理解
在druid进行配置时,首先需要搞清楚druid的整体架构、节点等概念,这对于后续各节点配置有更好的作用,druid整体架构如下:(1)broker Nodes:对于Historical Nodes和Real-time Nodes来说作用是查询路由,所有的客户端请求都会发送到Broker Nodes中,该节点知道在zookeeper之上的segments信息,哪些segments是可查...转载 2019-07-13 01:09:08 · 469 阅读 · 0 评论 -
【Druid总结】
Druid总结:https://www.jianshu.com/p/ce2f2a714c01原创 2019-07-12 00:52:09 · 192 阅读 · 0 评论 -
druid 和 CDH关于hadoop版本不兼容问题
如果druid的hadoop版本和CDH带的版本不一致,则在MR,比如Hadoop-based Batch Ingestion则有可能报错,解决方法是:在middle mgr runtime.properties 配置中加入如下信息:-Dhadoop.mapreduce.job.classloader=true -DHADOOP_USER_NAME=hdfs...原创 2019-07-17 16:28:18 · 879 阅读 · 0 评论 -
Druid.io系列5:查询过程
Druid使用JSON over HTTP 作为底层的查询语言,不过强大的社区也为我们提供了多种查询方式,比如Python接口pydruid、R接口RDruid、JavaScript接口plywood、类SQL接口plyql、PHP接口druid-php等。Druid查询目前只支持单表操作,基本涵盖了ANSISQL中常用的查询语句,包括:聚合类(Aggregation)查询 时间序列查询 TopN...转载 2018-04-30 23:54:15 · 878 阅读 · 0 评论 -
Druid.io系列3:Druid集群节点
1 Historical NodeHistorical Node的职责单一,就是负责加载Druid中非实时窗口内且满足加载规则的所有历史数据的Segment。每一个Historical Node只与Zookeeper保持同步,不与其他类型节点或者其他Historical Node进行通信。根据上节知晓,Coordinator Nodes会定期(默认为1分钟)去同步元信息库,感知新生成的Segmen...原创 2018-04-30 23:50:59 · 830 阅读 · 0 评论 -
Druid.io系列4:索引过程分析
Druid底层不保存原始数据,而是借鉴了Apache Lucene、Apache Solr以及ElasticSearch等检索引擎的基本做法,对数据按列建立索引,最终转化为Segment,用于存储、查询与分析。首先,无论是实时数据还是批量数据在进入Druid前都需要经过Indexing Service这个过程。在Indexing Service阶段,Druid主要做三件事:第一,将每条记录转换为列...原创 2018-04-30 23:49:05 · 434 阅读 · 0 评论 -
druid 配置详解
Java程序很大一部分要操作数据库,为了提高性能操作数据库的时候,有不得不使用数据库连接池。数据库连接池有很多选择,c3p、dhcp、proxool等,druid作为一名后起之秀,凭借其出色的性能,也逐渐印入了大家的眼帘。接下来本教程就说一下druid的简单使用。首先从 http://repo1.maven.org/maven2/com/alibaba/druid/ 下载最新的jar包。如转载 2017-06-05 17:49:03 · 3362 阅读 · 0 评论 -
CentOS7.1.x+Druid 0.12 集群配置
先决条件:安装版本列表 本次安装满足下面的条件:CentOS v7.3.x Druid v0.12.x Hadoop v2.9.0 (HDFS) MySql v5.6 Java 8.x其中,Mysql 和 Hadoop在别的文章中有讲述,本次安装不在涉及。在本次安装前,Mysql 和Hadoop 必须已安装完毕。一、默认端口建议用如下的命令停掉CentOS上...原创 2018-04-19 14:48:33 · 2084 阅读 · 1 评论 -
Druid.io系列连载文章
Druid.io系列(一):简介Druid.io系列(二):基本概念与架构Druid.io系列(三): Druid集群节点Druid.io系列(四):索引过程分析Druid.io系列(五):查询过程Druid.io系列(六):问题总结...转载 2018-03-23 01:06:41 · 518 阅读 · 0 评论 -
druid中 如何从本地批(batch)导入与从hdfs 批导入数据 实战
使用indexing service 批导入数据,如何配置task文件,指定从本地 和 hdfs中导入数据。很多在手册中没有详细说明,配置起来存在困难。先搭建几个节点:coordinator、historical、overlord、middleManager。并且启动服务。前提:需要准备好mysql(http://my.oschina.net/u/2460844/blog/637334 ...原创 2018-03-31 12:56:00 · 3764 阅读 · 1 评论 -
druid如何用利用tranquity server 向druid发送实时数据
1. 前提条件 分布式druid系统安装已经完毕,安装过程见 https://blog.csdn.net/bigtree_3721/article/details/79583008参考doc: https://github.com/druid-io/tranquility/blob/master/docs/server.md2. 下载tranquility server官方下载地址:http:...原创 2018-04-02 19:39:32 · 1477 阅读 · 2 评论 -
推荐 tranquity 重大问题及其解决方案
https://fangyeqing.github.io/categories/druid-io/https://fangyeqing.github.io/2017/03/14/druid.io实践5---druid.io问题记录/https://github.com/druid-io/tranquility/blob/master/docs/configuration.md注意看实践5,这是重点...转载 2018-04-04 20:55:31 · 1529 阅读 · 1 评论 -
推荐:Druid + Grafana 应用实践
到大数据,大家首先想到的肯定是Hadoop,近年来互联网技术的快速增长催生了各类大体量数据的爆发,Hadoop最大的贡献在于帮助企业将那些低价值的事件流数据转化为高价值的聚合数据,为企业的经营决策提供数据支撑。但Hadoop擅长的是存储和获取大规模数据,但是它并不提供任何性能上的保证。从这个角度来讲,我们可以把Hadoop看作是一个很好的后端、批量处理和数据仓库系统。在一个需要高并发并且保证查询性...转载 2018-03-29 16:22:48 · 6153 阅读 · 0 评论 -
大数据 Druid 几种数据输入方式的探讨
从Kafka,RabbitMQ,Storm 中摄入实时数据流时到Druid的时候,可以使用Realtime Node,Index Server,Tranquility进行数据摄入。本文主要探索这几种数据摄入方式的区别。Realtime NodeRealtime Node 可以直接配置Firehose从Kafka,RabbitMQ等消息队列中获取数据,数据一旦被摄入,很快就可以被查询到, 同时Rea...转载 2018-04-30 23:47:35 · 1556 阅读 · 1 评论 -
连接池 Druid 详细介绍
Druid的简介Druid首先是一个数据库连接池。Druid是目前最好的数据库连接池,在功能、性能、扩展性方面,都超过其他数据库连接池,包括DBCP、C3P0、BoneCP、Proxool、JBoss DataSource。Druid已经在阿里巴巴部署了超过600个应用,经过一年多生产环境大规模部署的严苛考验。同时Druid不仅仅是一个数据库连接池,它包括三个部分: 1.转载 2017-06-05 17:40:48 · 1555 阅读 · 0 评论