GeoHash索引

GeoHash简介

GeoHash索引是一种基于B树索引,又结合了格网索引的思想的使用广泛的空间索引算法。GeoHash将空间位置编码为一串字符,通过字符串的比较可以得到空间的大致范围。这种编码方法起初被用于以唯一的URL标识地图上的点实体,而点实体一般是以经纬度标识的,所以问题就转变为如何使用URL标识经纬度坐标。下面举例说明GeoHash编码的具体实现步骤。设定武汉大学的经纬度坐标是(114.360734E, 30.541093N),首先,可以通过如下算法对纬度30.54进行逼近编码:
(1)对维度区间[-90,90]进行二分为[-90,0)和[0,90],称为左右区间,可以确定30.541093属于右区间[0,90],给标记为1;
(2)接着将区间[0,90]进行二分为 [0,45)和[45,90],可以确定30.541093属于左区间 [0,45),给标记为0;
(3)递归上述过程30.541093,如果给定的纬度属于左区间,则记录0,如果属于右区间则记录1,这样随着算法的进行会产生一个序列101010110110111,序列的长度跟给定的区间划分次数有关。
(4)同样的方法,对经度区间[-180, 180]进行编码,可以得到一个二进制序列110100010101001。
(5)合并经纬度编码,偶数位放经度编码(第一位从0开始),奇数位放纬度编码,把两串编码组合生成新串11100 11001 00011 10011 01100 10111。
(6)对合成的新的二进制串,每五位转成十进制数得到28,25,3,19,12,23,然后再进行Base32编码得到该经纬度的GeoHash编码为wt3mdr。

GeoHash

对于GeoHash索引,需要明确的是:(1)GeoHash编码值表示的并不是一个点,而是一个矩形区域。落在该矩形区域的所有点都可以用该编码表示。(2)字符串越长,表示的范围越精确。编码的前缀可以表示更大的区域。例如wt3mdrff,它的前缀wt3mdr表示包含编码wt3mdrff在内的更大范围。 利用该特性可以进行临近点的搜索。首先根据用户当前坐标计算GeoHash值,然后取其前缀进行查询。(3)GeoHash将区域划分为一个个规则矩形,位于矩形边界两侧的两点,虽然十分接近,但编码会完全不同,因为它的编码方式从左上到右下突变时存在不连续的“跳跃”。

一个例子

下面的例子用到了一个第三方GeoHash库,我使用maven构建项目,pom文件如下:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
  <modelVersion>4.0.0</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值