从Druid的官方文档来看,Druid是支持空间过滤的,但是在实际使用的时候发现,并不是很好用。先看官网的使用指南。
https://druid.apache.org/docs/latest/development/geo.html
看使用指南觉着提供一个中心和距离就可以用啦,但在测试的时候,效果总是不对。。
看代码发现,Druid的空间过滤功能和想想的并不一样。代码中关于radius部分的过滤的代码如下:
public boolean contains(float[] otherCoords)
{
double total = 0.0;
for (int i = 0; i < coords.length; i++) {
total += Math.pow(otherCoords[i] - coords[i], 2);
}
return (total <= Math.pow(radius, 2));
}
这和真正的空间过滤很明显差距不小,感觉是为了加快查询速度吧,毕竟Druid对查询速度要求很高。
没办法,和别人讨论后,采用折衷方案,写查询SQL的时候,自己写好空间查询条件:
SELECT
MyDataRows,
FROM "Datasource"
WHERE
(POWER(DataLatitude-52.1, 2) + POWER( (DataLongitude-5.1)*COS(RADIANS(52.1)),2)) < POWER(5/110.25, 2)
https://github.com/apache/druid/issues/9847
功能和我们想要的是一样的0.0..
但对于本机查询的应用场景,如果使用json格式查询,就没办法自己写了。我的办法是修改源码中RadiusBound的代码:
把下边这一段替换掉,然后重新编译,就可以正常使用啦。
public boolean contains(float[] otherCoords)
{
double total = 0.0;
for (int i = 0; i < coords.length; i++) {
total += Math.pow(otherCoords[i] - coords[i], 2);
}
return (total <= Math.pow(radius, 2));
}