![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Apache Druid
文章平均质量分 60
香山上的麻雀1008
大数据
展开
-
Apache Druid | Subquery generated results beyond maximum[100000]
报错信息今天用Druid(版本0.18.0) 做两个DataSource的join时报错:Resource limit exceeded / Subquery generated results beyond maximum[100000] / org.apache.druid.query.ResourceLimitExceededException报错意思就是子查询结果超过了最大限定100000行查阅资料后发现这个参数由druid.server.http.maxSubqueryRows来控制原创 2021-02-02 17:57:28 · 578 阅读 · 0 评论 -
Apache Druid 解析ORC及parquet格式的数据
Apache Druid可以从本地或者HDFS批量摄取数据,现在最新版本(0.18)也支持直接解析ORC及parquet格式的数据,但是要使用这个功能还需要进行简单的配置。官方文档说明Apache Druid打包了所有的核心扩展(参考本文附件),您可以通过将需要的扩展名添加到common.runtime.properties中的druid.extensions.loadList。例如,要加载postqresql-metadata-storage和druid-hdfs-storage扩展,请使用配置:d原创 2021-02-02 15:09:06 · 630 阅读 · 0 评论 -
Apache Druid集群关闭/重启
Apache Druid提供了启动不同集群的脚本:但是却并没有提供集群stop的脚本。那么怎么停止集群呢?第一种方法就是比较简单粗暴:直接 ps -ef | grep xxx ,获取pid之后直接kill。第二种方法就是:$ bin/service --helpUnknown option: helpusage: bin/service (--restart <service> | --tail <service> | --down) [-d <原创 2021-02-02 14:50:45 · 1752 阅读 · 2 评论 -
使用SQLAlchemy URI 连接Apache Druid
最新版本的superset已经将Apache Druid的本地connector去掉了,所以我们用pydruid的SQLAlchemy URI来连接Druid选择数据库:ip地址:就是Apache Druid 的router节点的地址port:就是Apache Druid的router节点的端口,我自己修改过,所以不是默认端口...原创 2020-09-08 10:07:00 · 1069 阅读 · 2 评论 -
如何将Hive中的数据导入到Druid中
Apache Druid是一个实时OLAP型数据库,现在有一个需求就是将Hive中的一张大表,导入到Druid中,然后应用层直接查询Druid。接下来就是将Hive中的数据导入到Druid的详细步骤:###我的方案是直接从HDFS上将源文件直接load过去0. 系统基本信息Druid版本0.18hadoop版本cdh集成的2.6.0使用的是Druid的single-server中的mi...原创 2020-04-30 11:10:16 · 1708 阅读 · 0 评论 -
Druid SQL官方文档
Apache Druid supports two query languages: Druid SQL and native queries.This document describes the SQL language.Druid SQL is a built-in SQL layer and an alternative to Druid’s native JSON-based...原创 2020-04-28 16:21:59 · 3367 阅读 · 2 评论