JAVA实现空间索引编码(GeoHash)

8 篇文章 0 订阅

转载请注明出处:http://blog.csdn.net/xiaojimanman/article/details/50358506

http://www.llwjy.com/blogdetail/95468c5334d1c3fe52ae2149abfb0da0.html

个人博客站已经上线了,网址 www.llwjy.com ~欢迎各位吐槽~

-------------------------------------------------------------------------------------------------

      之前自己在做基于Lucene的内容检索过程中,了解到Lucene可以实现对文本信息,数值信息的内容检索,对于空间距离好像并为为源码中实现;最近半年自己接触到Solr,里面有一个空间距离检索(经纬度),最近对其中的实现做了下学习,了解到在实现空间距离检索的有一个比较常用的技术——GeoHash,下面就介绍下GeoHash。


GeoHash特点

1)GeoHash用一个字符串表示经度和纬度两个坐标,比如我现在所在位置的GeoHash值为 wx4sv61q;

2)GeoHash标识的并不是一个点,而是一个区域,比如 wx4sv61q 对应的就是一个矩形区域;

3)编码的前缀可以标识更大的区域,比如 wx4sv61 编码代表的区域要大于 wx4sv61q 代表的区域,但是 wx4sv61q 代表的区域一定在 wx4sv61 代表的区域内。

      因此我们再去做距离检索的时候,只需要对GeoHash进行前缀匹配即可,具体的原因在后面内容进行介绍。


GeoHash原理

      GeoHash最简单的解释就是将一个位置信息转化成一个可以排序、可以比较的字符串编码。下面就详细介绍以下其实现过程:

      维基百科对GeoHash的介绍:https://en.wikipedia.org/wiki/Geohash

      首先我们将纬度(-90, 90)平均分成两个区间(-90, 0)、(0, 90),如果坐标位置的纬度值在第一区间,则编码是0,否则编码为1。我们用 40.222012 举例,由于40.222012 属于 (0, 90),所以编码为1,然后我们继续将(0, 90)分成(0, 45)、(45, 90)两个区间,而40.222012 位于(0, 45),所以编码是0,依次类推,我们进行20次拆分,最后计算40.222012 的编码是 10111001001101000110。

      对于经度采用同样的的方法,得到 116.248283 的编码是 11010010101010100101。

      接下来我们对经纬度的编码合并,奇数为是纬度,偶数为是经度,得到的编码是 1110011101001001100011011001100000110110(这里需要特别注意,这里说的奇数、偶数是值数组的下标,从0开始的);

      最后用base32编码,二进制串对应的十进制分别为 28, 29, 4, 24, 27, 6, 1, 22,转化为base32是wx4sv61q,因此就 得到(40.222012, 116.248283) 的编码为 wx4sv61q。(下图介绍了base32的对应关系)

img

      编码 wx4sv61q 在地图上对应的位置如下图:

img

      这里我们GeoHash的编码长度为8,这时精度在19米,下表列出了不同的编码长度对应的精度:

img

img

      由上面的精度可知,如果要选取和我(40.222012, 116.248283)相距2km内的物品,我们只需要查找物品坐标对应的GeoHash以wx4sv为前缀的即可。


GeoHash延伸

      到目前为止我们对空间索引有了一定的了解,但是上面介绍的内容对下面的一种情况就无法实现(下面这幅图出自他人的博客):

img

      我们从图中可以看出,红点与上方的绿点距离较近,与下方的绿点距离较远,但是红点与下方的绿点的编码字符串一样,都是wx4g0。对于GeoHash这种边界问题解决思路也十分简单,我们在做检索或者查询的时候,对周围的八个区域进行匹配,这样就很好的解决了边界问题。下面我们就对GeoHash用java进行实现。


JAVA实现

      在实现之前,我们首先定义一个LocationBean,用它来表示经纬度信息:

  1. /**
  2. *@Description: 存储经纬度信息
  3. */
  4. package com.lulei.geo.bean;
  5. public class LocationBean {
  6. public static final double MINLAT = - 90;
  7. public static final double MAXLAT = 90;
  8. public static final double MINLNG = - 180;
  9. public static final double MAXLNG = 180;
  10. private double lat; //纬度[-90,90]
  11. private double lng; //经度[-180,180]
  12. public LocationBean(double lat, double lng) {
  13. this.lat = lat;
  14. this.lng = lng;
  15. }
  16. public double getLat() {
  17. return lat;
  18. }
  19. public void setLat(double lat) {
  20. this.lat = lat;
  21. }
  22. public double getLng() {
  23. return lng;
  24. }
  25. public void setLng(double lng) {
  26. this.lng = lng;
  27. }
  28. }

      然后我们编写一个类,来实现GeoHash,在实现GeoHash的过程中,我们需要用 定义一些常量以及经纬度信息,具体如下:

  1. public class GeoHash {
  2. private LocationBean location;
  3. /**
  4. * 1 2500km;2 630km;3 78km;4 30km
  5. * 5 2.4km; 6 610m; 7 76m; 8 19m
  6. */
  7. private int hashLength = 8; //经纬度转化为geohash长度
  8. private int latLength = 20; //纬度转化为二进制长度
  9. private int lngLength = 20; //经度转化为二进制长度
  10. private double minLat; //每格纬度的单位大小
  11. private double minLng; //每个经度的倒下
  12. private static final char[] CHARS = { '0', '1', '2', '3', '4', '5', '6', '7',
  13. '8', '9', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j', 'k', 'm', 'n',
  14. 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z'};
  15. }


      在GeoHash实例化时,我们需要对一些 属性进行赋值

  1. public GeoHash(double lat, double lng) {
  2. location = new LocationBean(lat, lng);
  3. setMinLatLng();
  4. }
  5. public int gethashLength() {
  6. return hashLength;
  7. }
  8. /**
  9. * @Author:lulei
  10. * @Description: 设置经纬度的最小单位
  11. */
  12. private void setMinLatLng() {
  13. minLat = LocationBean.MAXLAT - LocationBean.MINLAT;
  14. for ( int i = 0; i < latLength; i++) {
  15. minLat /= 2.0;
  16. }
  17. minLng = LocationBean.MAXLNG - LocationBean.MINLNG;
  18. for ( int i = 0; i < lngLength; i++) {
  19. minLng /= 2.0;
  20. }
  21. }

      我们在使用GeoHash的时候,需要 设置最终编码的长度,因此编写一个方法实现对GeoHash长度的设置

  1. public boolean sethashLength(int length) {
  2. if (length < 1) {
  3. return false;
  4. }
  5. hashLength = length;
  6. latLength = (length * 5) / 2;
  7. if (length % 2 == 0) {
  8. lngLength = latLength;
  9. } else {
  10. lngLength = latLength + 1;
  11. }
  12. setMinLatLng();
  13. return true;
  14. }

      有了这些设置之后,我们需要 将经度、纬度转化为对应的二进制编码

  1. private boolean[] getHashArray( double value, double min, double max, int length) {
  2. if (value < min || value > max) {
  3. return null;
  4. }
  5. if (length < 1) {
  6. return null;
  7. }
  8. boolean[] result = new boolean[length];
  9. for ( int i = 0; i < length; i++) {
  10. double mid = (min + max) / 2.0;
  11. if (value > mid) {
  12. result[i] = true;
  13. min = mid;
  14. } else {
  15. result[i] = false;
  16. max = mid;
  17. }
  18. }
  19. return result;
  20. }


      分别获取经纬度的二进制编码后,我们需要 将两个二进制字符串合并成一个

  1. private boolean[] merge( boolean[] latArray, boolean[] lngArray) {
  2. if (latArray == null || lngArray == null) {
  3. return null;
  4. }
  5. boolean[] result = new boolean[lngArray.length + latArray.length];
  6. Arrays.fill(result, false);
  7. for ( int i = 0; i < lngArray.length; i++) {
  8. result[ 2 * i] = lngArray[i];
  9. }
  10. for ( int i = 0; i < latArray.length; i++) {
  11. result[ 2 * i + 1] = latArray[i];
  12. }
  13. return result;
  14. }

      最后我们需要将获得的 二进制转进行base32转化

  1. /**
  2. * @param lat
  3. * @param lng
  4. * @return
  5. * @Author:lulei
  6. * @Description: 获取经纬度的base32字符串
  7. */
  8. private String getGeoHashBase32(double lat, double lng) {
  9. boolean[] bools = getGeoBinary(lat, lng);
  10. if (bools == null) {
  11. return null;
  12. }
  13. StringBuffer sb = new StringBuffer();
  14. for ( int i = 0; i < bools.length; i = i + 5) {
  15. boolean[] base32 = new boolean[ 5];
  16. for ( int j = 0; j < 5; j++) {
  17. base32[j] = bools[i + j];
  18. }
  19. char cha = getBase32Char(base32);
  20. if ( ' ' == cha) {
  21. return null;
  22. }
  23. sb.append(cha);
  24. }
  25. return sb.toString();
  26. }
  27. /**
  28. * @param base32
  29. * @return
  30. * @Author:lulei
  31. * @Description: 将五位二进制转化为base32
  32. */
  33. private char getBase32Char(boolean[] base32) {
  34. if (base32 == null || base32.length != 5) {
  35. return ' ';
  36. }
  37. int num = 0;
  38. for ( boolean bool : base32) {
  39. num <<= 1;
  40. if (bool) {
  41. num += 1;
  42. }
  43. }
  44. return CHARS[num % CHARS.length];
  45. }

      对于如何获取周围八个区域的GeoHash值这个问题我们可以做如下转化,我们已经知道当前点的经纬度值,我们也知道每一个区域内的经度、纬度的宽度,如果经度加上或减去这个宽度,我们就可以位于该区域左侧和右侧区域的经度,如果纬度加上或减去这个宽度,我们就可以获取该区域上部和下部的纬度,这样我们就可以分别获取到该区域周围八个区域内的一个点的坐标,我们分别计算这八个点的坐标,也就是八个区域对应的GeoHash编码。

  1. public List<String> getGeoHashBase32For9() {
  2. double leftLat = location.getLat() - minLat;
  3. double rightLat = location.getLat() + minLat;
  4. double upLng = location.getLng() - minLng;
  5. double downLng = location.getLng() + minLng;
  6. List<String> base32For9 = new ArrayList<String>();
  7. //左侧从上到下 3个
  8. String leftUp = getGeoHashBase32(leftLat, upLng);
  9. if (!(leftUp == null || "".equals(leftUp))) {
  10. base32For9.add(leftUp);
  11. }
  12. String leftMid = getGeoHashBase32(leftLat, location.getLng());
  13. if (!(leftMid == null || "".equals(leftMid))) {
  14. base32For9.add(leftMid);
  15. }
  16. String leftDown = getGeoHashBase32(leftLat, downLng);
  17. if (!(leftDown == null || "".equals(leftDown))) {
  18. base32For9.add(leftDown);
  19. }
  20. //中间从上到下 3个
  21. String midUp = getGeoHashBase32(location.getLat(), upLng);
  22. if (!(midUp == null || "".equals(midUp))) {
  23. base32For9.add(midUp);
  24. }
  25. String midMid = getGeoHashBase32(location.getLat(), location.getLng());
  26. if (!(midMid == null || "".equals(midMid))) {
  27. base32For9.add(midMid);
  28. }
  29. String midDown = getGeoHashBase32(location.getLat(), downLng);
  30. if (!(midDown == null || "".equals(midDown))) {
  31. base32For9.add(midDown);
  32. }
  33. //右侧从上到下 3个
  34. String rightUp = getGeoHashBase32(rightLat, upLng);
  35. if (!(rightUp == null || "".equals(rightUp))) {
  36. base32For9.add(rightUp);
  37. }
  38. String rightMid = getGeoHashBase32(rightLat, location.getLng());
  39. if (!(rightMid == null || "".equals(rightMid))) {
  40. base32For9.add(rightMid);
  41. }
  42. String rightDown = getGeoHashBase32(rightLat, downLng);
  43. if (!(rightDown == null || "".equals(rightDown))) {
  44. base32For9.add(rightDown);
  45. }
  46. return base32For9;
  47. }

运行结果


img


完整代码

      上面的博客中已经有完整的LoacationBean代码,这里就不再写了。

  1. /**
  2. *@Description: GeoHash实现经纬度的转化
  3. */
  4. package com.lulei.geo;
  5. import java.util.ArrayList;
  6. import java.util.Arrays;
  7. import java.util.List;
  8. import com.lulei.geo.bean.LocationBean;
  9. import com.lulei.util.JsonUtil;
  10. public class GeoHash {
  11. private LocationBean location;
  12. /**
  13. * 1 2500km;2 630km;3 78km;4 30km
  14. * 5 2.4km; 6 610m; 7 76m; 8 19m
  15. */
  16. private int hashLength = 8; //经纬度转化为geohash长度
  17. private int latLength = 20; //纬度转化为二进制长度
  18. private int lngLength = 20; //经度转化为二进制长度
  19. private double minLat; //每格纬度的单位大小
  20. private double minLng; //每个经度的倒下
  21. private static final char[] CHARS = { '0', '1', '2', '3', '4', '5', '6', '7',
  22. '8', '9', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j', 'k', 'm', 'n',
  23. 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z'};
  24. public GeoHash(double lat, double lng) {
  25. location = new LocationBean(lat, lng);
  26. setMinLatLng();
  27. }
  28. public int gethashLength() {
  29. return hashLength;
  30. }
  31. /**
  32. * @Author:lulei
  33. * @Description: 设置经纬度的最小单位
  34. */
  35. private void setMinLatLng() {
  36. minLat = LocationBean.MAXLAT - LocationBean.MINLAT;
  37. for ( int i = 0; i < latLength; i++) {
  38. minLat /= 2.0;
  39. }
  40. minLng = LocationBean.MAXLNG - LocationBean.MINLNG;
  41. for ( int i = 0; i < lngLength; i++) {
  42. minLng /= 2.0;
  43. }
  44. }
  45. /**
  46. * @return
  47. * @Author:lulei
  48. * @Description: 求所在坐标点及周围点组成的九个
  49. */
  50. public List<String> getGeoHashBase32For9() {
  51. double leftLat = location.getLat() - minLat;
  52. double rightLat = location.getLat() + minLat;
  53. double upLng = location.getLng() - minLng;
  54. double downLng = location.getLng() + minLng;
  55. List<String> base32For9 = new ArrayList<String>();
  56. //左侧从上到下 3个
  57. String leftUp = getGeoHashBase32(leftLat, upLng);
  58. if (!(leftUp == null || "".equals(leftUp))) {
  59. base32For9.add(leftUp);
  60. }
  61. String leftMid = getGeoHashBase32(leftLat, location.getLng());
  62. if (!(leftMid == null || "".equals(leftMid))) {
  63. base32For9.add(leftMid);
  64. }
  65. String leftDown = getGeoHashBase32(leftLat, downLng);
  66. if (!(leftDown == null || "".equals(leftDown))) {
  67. base32For9.add(leftDown);
  68. }
  69. //中间从上到下 3个
  70. String midUp = getGeoHashBase32(location.getLat(), upLng);
  71. if (!(midUp == null || "".equals(midUp))) {
  72. base32For9.add(midUp);
  73. }
  74. String midMid = getGeoHashBase32(location.getLat(), location.getLng());
  75. if (!(midMid == null || "".equals(midMid))) {
  76. base32For9.add(midMid);
  77. }
  78. String midDown = getGeoHashBase32(location.getLat(), downLng);
  79. if (!(midDown == null || "".equals(midDown))) {
  80. base32For9.add(midDown);
  81. }
  82. //右侧从上到下 3个
  83. String rightUp = getGeoHashBase32(rightLat, upLng);
  84. if (!(rightUp == null || "".equals(rightUp))) {
  85. base32For9.add(rightUp);
  86. }
  87. String rightMid = getGeoHashBase32(rightLat, location.getLng());
  88. if (!(rightMid == null || "".equals(rightMid))) {
  89. base32For9.add(rightMid);
  90. }
  91. String rightDown = getGeoHashBase32(rightLat, downLng);
  92. if (!(rightDown == null || "".equals(rightDown))) {
  93. base32For9.add(rightDown);
  94. }
  95. return base32For9;
  96. }
  97. /**
  98. * @param length
  99. * @return
  100. * @Author:lulei
  101. * @Description: 设置经纬度转化为geohash长度
  102. */
  103. public boolean sethashLength(int length) {
  104. if (length < 1) {
  105. return false;
  106. }
  107. hashLength = length;
  108. latLength = (length * 5) / 2;
  109. if (length % 2 == 0) {
  110. lngLength = latLength;
  111. } else {
  112. lngLength = latLength + 1;
  113. }
  114. setMinLatLng();
  115. return true;
  116. }
  117. /**
  118. * @return
  119. * @Author:lulei
  120. * @Description: 获取经纬度的base32字符串
  121. */
  122. public String getGeoHashBase32() {
  123. return getGeoHashBase32(location.getLat(), location.getLng());
  124. }
  125. /**
  126. * @param lat
  127. * @param lng
  128. * @return
  129. * @Author:lulei
  130. * @Description: 获取经纬度的base32字符串
  131. */
  132. private String getGeoHashBase32(double lat, double lng) {
  133. boolean[] bools = getGeoBinary(lat, lng);
  134. if (bools == null) {
  135. return null;
  136. }
  137. StringBuffer sb = new StringBuffer();
  138. for ( int i = 0; i < bools.length; i = i + 5) {
  139. boolean[] base32 = new boolean[ 5];
  140. for ( int j = 0; j < 5; j++) {
  141. base32[j] = bools[i + j];
  142. }
  143. char cha = getBase32Char(base32);
  144. if ( ' ' == cha) {
  145. return null;
  146. }
  147. sb.append(cha);
  148. }
  149. return sb.toString();
  150. }
  151. /**
  152. * @param base32
  153. * @return
  154. * @Author:lulei
  155. * @Description: 将五位二进制转化为base32
  156. */
  157. private char getBase32Char(boolean[] base32) {
  158. if (base32 == null || base32.length != 5) {
  159. return ' ';
  160. }
  161. int num = 0;
  162. for ( boolean bool : base32) {
  163. num <<= 1;
  164. if (bool) {
  165. num += 1;
  166. }
  167. }
  168. return CHARS[num % CHARS.length];
  169. }
  170. /**
  171. * @param lat
  172. * @param lng
  173. * @return
  174. * @Author:lulei
  175. * @Description: 获取坐标的geo二进制字符串
  176. */
  177. private boolean[] getGeoBinary( double lat, double lng) {
  178. boolean[] latArray = getHashArray(lat, LocationBean.MINLAT, LocationBean.MAXLAT, latLength);
  179. boolean[] lngArray = getHashArray(lng, LocationBean.MINLNG, LocationBean.MAXLNG, lngLength);
  180. return merge(latArray, lngArray);
  181. }
  182. /**
  183. * @param latArray
  184. * @param lngArray
  185. * @return
  186. * @Author:lulei
  187. * @Description: 合并经纬度二进制
  188. */
  189. private boolean[] merge( boolean[] latArray, boolean[] lngArray) {
  190. if (latArray == null || lngArray == null) {
  191. return null;
  192. }
  193. boolean[] result = new boolean[lngArray.length + latArray.length];
  194. Arrays.fill(result, false);
  195. for ( int i = 0; i < lngArray.length; i++) {
  196. result[ 2 * i] = lngArray[i];
  197. }
  198. for ( int i = 0; i < latArray.length; i++) {
  199. result[ 2 * i + 1] = latArray[i];
  200. }
  201. return result;
  202. }
  203. /**
  204. * @param value
  205. * @param min
  206. * @param max
  207. * @return
  208. * @Author:lulei
  209. * @Description: 将数字转化为geohash二进制字符串
  210. */
  211. private boolean[] getHashArray( double value, double min, double max, int length) {
  212. if (value < min || value > max) {
  213. return null;
  214. }
  215. if (length < 1) {
  216. return null;
  217. }
  218. boolean[] result = new boolean[length];
  219. for ( int i = 0; i < length; i++) {
  220. double mid = (min + max) / 2.0;
  221. if (value > mid) {
  222. result[i] = true;
  223. min = mid;
  224. } else {
  225. result[i] = false;
  226. max = mid;
  227. }
  228. }
  229. return result;
  230. }
  231. public static void main(String[] args) {
  232. // TODO Auto-generated method stub
  233. GeoHash g = new GeoHash( 40.222012, 116.248283);
  234. System.out.println(g.getGeoHashBase32());
  235. System.out.println(JsonUtil.parseJson(g.getGeoHashBase32For9()));
  236. }
  237. }



-------------------------------------------------------------------------------------------------
小福利
-------------------------------------------------------------------------------------------------
      个人在极客学院上《Lucene案例开发》课程已经上线了(目前上线到第二课),欢迎大家吐槽~

第一课:Lucene概述

第二课:Lucene 常用功能介绍

第三课:网络爬虫

第四课:数据库连接池

第五课:小说网站的采集

第六课:小说网站数据库操作

第七课:小说网站分布式爬虫的实现
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xiaojimanman/article/details/50358506
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值