第四章：druid.io的功能

最新推荐文章于 2020-12-10 23:48:02 发布

fish_cool

最新推荐文章于 2020-12-10 23:48:02 发布

阅读量5.6k

点赞数 3

分类专栏： druid.io

本文链接：https://blog.csdn.net/chenyi8888/article/details/45740415

版权

druid.io 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

目前druid.io的版本已经发展到0.7.1了，其功能也在不断的完善中，功能的基本描述及使用在官方文档上面已经有很详细的介绍。

这里将不对功能做过多的描述，重点是在用的过程和怎么用。

目前druid.io提供了几个查询类型功能：

1、groupby

2、search

3、segment Metadata

4、timeseries

5、topN

6、datasource metadata

其中1、2、4、5属于使用功能；3、6属于管理功能。

在使用功能范围内，使用非常频繁的是1、4，然后是2、5。

先说简单的使用：

对于search应用，类似于在输入框里进行自动补全功能，不过druid.io支持的多个维度匹配和对多个value的匹配，个人觉得search的场景有很多替代方案。多个维度search做过滤时，是没有记录关联性的。对于另一个topN来说，应用场景多数是排行榜这样的统计，例如：统计下载量排名前十的APP，topN是groupby功能的一个特例，在druid.io单独作为一个功能是对其进行了优化处理。关于排序的方式也有很多细节的区别，例如：数字排序、lexicographic、AlphaNumberic等。 AlphaNumberic方式功能很强，如下：

Traditional

Alphanum

z1.doc
z10.doc
z100.doc
z101.doc
z102.doc
z11.doc
z12.doc
z13.doc
z14.doc
z15.doc
z16.doc
z17.doc
z18.doc
z19.doc
z2.doc
z20.doc
z3.doc
z4.doc
z5.doc
z6.doc
z7.doc
z8.doc
z9.doc

z1.doc
z2.doc
z3.doc
z4.doc
z5.doc
z6.doc
z7.doc
z8.doc
z9.doc
z10.doc
z11.doc
z12.doc
z13.doc
z14.doc
z15.doc
z16.doc
z17.doc
z18.doc
z19.doc
z20.doc
z100.doc
z101.doc
z102.doc

目前的topN只支持单维度。
关于timeseries的方式，也可以认为是 groupby功能的一个特例，主要针对没有维度选择的场景，这样可以提高计算和响应时间。

重点说下groupby类型，因为它是其它查询类型延伸的基础，整个groupby类型，包含维度选择、统计指标选择、过滤条件、时间范围及时区、排序方式、结果集返回大小，数据集选择。

维度选择属性dimensions

对于维度，细节可以做到展示名称与存储名称分离；提供维度值转换后的统计方式，例如：我要按ip前三段来做统计