注意:
下载链接:sudo curl -o druid.tar.gz https://mirror.bit.edu.cn/apache/druid/0.19.0/apache-druid-0.19.0-bin.tar.gz
https://blog.csdn.net/github_39577257/article/details/96803834
虚拟机虚拟内存请设置大点;注意druid安装版本,版本不同则安装问题不同;
安装示例参考:https://developer.aliyun.com/article/58780
亲测有效:
端口无法访问参考:
亲测有效:
https://blog.csdn.net/ywd1992/article/details/80401630
简单实用:
1、启动后使用Router配置的端口即可访问,
2、根据官网提示选中加载对应的文件,按部就班就可看到文件的数据;
3、接口话访问数据
druid可以直接使用http接口来查询数据,但需要对查询的sql做转换,是一种http参数的类sql查询。
问题处理:
1、提示IP已绑定;
此时需要在conf对应的文件中修改对应的端口,注意,端口为80XX,我修改为70XX启动时无法正常启动,且提示实例或端口已占用等其他的很多异常错误,参考上文的端口修改后恢复正常。
2、提示java JDK问题
如果java版本确定是java8以上后,说明你的java安装没有问题,启动异常说明你启动用户权限或对应用户的环境变量配置可能异常;笔者在linux ubuntu .18.04内启动时一直提示java版本异常,后切换为root后再次配置环境变量后就不在提示了。
3、提示server 实例不存在,
这个问题很奇怪,虽然日志提示错误,但是却有时可正常访问,可能是端口被占用导致,由于笔者所用环境中端口占用极多,没有细究。
4、使用http请求来查询案例数据
Druid的查询是使用REST风格的HTTP请求查询服务节点(Broker、Historical、Realtime),这些服务节点暴露REST查询接口,客户端发送Json对象请求查询接口。一般情况下,查询服务接口发布在Broker节点,POST请求查询如下所示:
查询的POST请求是: http://IP:routerPort/druid/v2/?pretty
请求体示例:
{
"queryType":"groupBy",
"dataSource":"dataSource",
"granularity":"hour",
"dimensions":[
"language"
],
"aggregations":[
{
"type":"count",
"name":"count"
}
],
"intervals":[
"2000-01-01T00:00Z/3000-01-01T00:00Z"
]
}
由于查询的json限制条件较多
可以参考:官网 https://www.apache-druid.cn/Tutorials/chapter-4.html
5、http查询二次开发,目前还没有详细研究,后续补充。
其他特性探索:
1、Apache Druid可以通过roll-up在数据摄取阶段对原始数据进行汇总。 Roll-up是对选定列集的一级聚合操作,它可以减小存储数据的大小。