JAVA实现空间索引编码(GeoHash)

转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/50358506

http://www.llwjy.com/blogdetail/95468c5334d1c3fe52ae2149abfb0da0.html

个人博客站已经上线了,网址 www.llwjy.com ~欢迎各位吐槽~

-------------------------------------------------------------------------------------------------

      之前自己在做基于Lucene的内容检索过程中,了解到Lucene可以实现对文本信息,数值信息的内容检索,对于空间距离好像并为为源码中实现;最近半年自己接触到Solr,里面有一个空间距离检索(经纬度),最近对其中的实现做了下学习,了解到在实现空间距离检索的有一个比较常用的技术——GeoHash,下面就介绍下GeoHash。


GeoHash特点

1)GeoHash用一个字符串表示经度和纬度两个坐标,比如我现在所在位置的GeoHash值为 wx4sv61q;

2)GeoHash标识的并不是一个点,而是一个区域,比如 wx4sv61q 对应的就是一个矩形区域;

3)编码的前缀可以标识更大的区域,比如 wx4sv61 编码代表的区域要大于 wx4sv61q 代表的区域,但是 wx4sv61q 代表的区域一定在 wx4sv61 代表的区域内。

      因此我们再去做距离检索的时候,只需要对GeoHash进行前缀匹配即可,具体的原因在后面内容进行介绍。


GeoHash原理

      GeoHash最简单的解释就是将一个位置信息转化成一个可以排序、可以比较的字符串编码。下面就详细介绍以下其实现过程:

      维基百科对GeoHash的介绍:https://en.wikipedia.org/wiki/Geohash

      首先我们将纬度(-90, 90)平均分成两个区间(-90, 0)、(0, 90),如果坐标位置的纬度值在第一区间,则编码是0,否则编码为1。我们用 40.222012 举例,由于40.222012 属于 (0, 90),所以编码为1,然后我们继续将(0, 90)分成(0, 45)、(45, 90)两个区间,而40.222012 位于(0, 45),所以编码是0,依次类推,我们进行20次拆分,最后计算40.222012 的编码是 10111001001101000110。

      对于经度采用同样的的方法,得到 116.248283 的编码是 11010010101010100101。

      接下来我们对经纬度的编码合并,奇数为是纬度,偶数为是经度,得到的编码是 1110011101001001100011011001100000110110(这里需要特别注意,这里说的奇数、偶数是值数组的下标,从0开始的);

      最后用base32编码,二进制串对应的十进制分别为 28, 29, 4, 24, 27, 6, 1, 22,转化为base32是wx4sv61q,因此就 得到(40.222012, 116.248283) 的编码为 wx4sv61q。(下图介绍了base32的对应关系)

img

      编码 wx4sv61q 在地图上对应的位置如下图:

img

      这里我们GeoHash的编码长度为8,这时精度在19米,下表列出了不同的编码长度对应的精度:

img

img

      由上面的精度可知,如果要选取和我(40.222012, 116.248283)相距2km内的物品,我们只需要查找物品坐标对应的GeoHash以wx4sv为前缀的即可。


GeoHash延伸

      到目前为止我们对空间索引有了一定的了解,但是上面介绍的内容对下面的一种情况就无法实现(下面这幅图出自他人的博客):

img

      我们从图中可以看出,红点与上方的绿点距离较近,与下方的绿点距离较远,但是红点与下方的绿点的编码字符串一样,都是wx4g0。对于GeoHash这种边界问题解决思路也十分简单,我们在做检索或者查询的时候,对周围的八个区域进行匹配,这样就很好的解决了边界问题。下面我们就对GeoHash用java进行实现。


JAVA实现

  • 11
    点赞
  • 63
    收藏
    觉得还不错? 一键收藏
  • 16
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值