Druid
攻城狮Kevin
爱学习,爱工作,爱生活
展开
-
Druid查询标签的各标签值uv及合并uv
一、Druid查询某一标签,各标签值的uv{ "queryType":"groupBy", "dataSource":"XXXX_enum_metric", "granularity":"DAY", "filter":{ "type":"and", "fields":[ { "type":"selector", "dimension":"tag_name", "value": "...原创 2020-06-03 15:46:25 · 293 阅读 · 0 评论 -
Druid压测和数据摄入优化
Druid压测结论: 1.“枚举型”和“连续数值型”在当前业务数据量级(500G左右)下摄入和查询功能可轻松支撑,摄入时长可保证30分钟以内,查询用时可保证200ms以内。 2.10倍于当前业务数据量级下,枚举型摄入时长可优化至2小时,连续数值型可优化至40分钟,查询用时可保证200ms以内。Druid数据摄入优化经验1.对HDFS文件开启gz压缩,测试gz格式比lzo格式入库要省30%的时间,因为数据压缩率变大。2.对tuningConfig里的"targetParti...原创 2020-05-20 15:25:55 · 456 阅读 · 0 评论 -
Druid支持枚举型和连续数值型标签分析——直方图/分位数
依据Druid对标签数据做分析时,将标签数据依据数据类型拆分成两个大类:枚举型和连续数值型,枚举值指标签值都为字符串,连续数值型指标签值都为数值型。Druid数据源表的结构如下CREATE TABLE `XXXX.XXXX_druid_enum/number_input`( `tag_name` string COMMENT '标签名', `tag_value` string COMMENT '标签值', `id_str` string COMMENT '用户id', `dt原创 2020-06-01 18:32:41 · 472 阅读 · 0 评论 -
Druid知识点及踩坑总结
1. Druid中的intervals参数 "spec" : { "ioConfig" : { "type" : "hadoop", "inputSpec" : { "type" : "granularity", "dataGranularity" : "DAY", "inputPath" : "/HDFS路径...原创 2020-02-20 19:50:01 · 1543 阅读 · 0 评论