(转)查找附近的xxx 球面距离以及Geohash方案探讨

随着移动终端的普及,很多应用都基于LBS功能,附近的某某(餐馆、银行、妹纸等等)。 

基础数据中,一般保存了目标位置的经纬度;利用用户提供的经纬度,进行对比,从而获得是否在附近。 

目标: 
查找附近的XXX,由近到远返回结果,且结果中有与目标点的距离。 

针对查找附近的XXX,提出两个方案,如下: 

一、方案A: 
=================================================================================================

抽象为球面两点距离的计算,即已知道球面上两点的经纬度; 
点(纬度,经度),A($radLat1,$radLng1)、B($radLat2,$radLng2); 

优点:通俗易懂,部署简单便捷 

缺点:每次都会查询数据库,性能堪忧 

1、推导 

通过余弦定理以及弧度计算方法,最终推导出来的算式A为: 
Php代码   收藏代码
  1. $s = acos(cos($radLat1)*cos($radLat2)*cos($radLng1-$radLng2)+sin($radLat1)*sin($radLat2))*$R;  

目前网上大多使用Google公开的距离计算公司,推导算式B为: 
Php代码   收藏代码
  1. $s = 2*asin(sqrt(pow(sin(($radLat1-$radLat2)/2),2)+cos($radLat1)*cos($radLat2)*pow(sin(($radLng1-$radLng2)/2),2)))*$R;  

其中 : 
$radLat1、$radLng1,$radLat2,$radLng2 为弧度 

$R 为地球半径 

2、通过测试两种算法,结果相同且都正确,但通过PHP代码测试,两点间距离,10W次性能对比,自行推导版本计算时长算式B较优,如下: 

//算式A 
0.56368780136108float(431) 
0.57460689544678float(431) 
0.59051203727722float(431) 

//算式B 
0.47404885292053float(431) 
0.47808718681335float(431) 
0.47946381568909float(431) 

3、所以采用数学方法推导出的公式: 
Php代码   收藏代码
  1. <?php  
  2.    
  3.     //根据经纬度计算距离 其中A($lat1,$lng1)、B($lat2,$lng2)  
  4.     public static function getDistance($lat1,$lng1,$lat2,$lng2)  
  5.     {  
  6.         //地球半径  
  7.         $R = 6378137;  
  8.    
  9.         //将角度转为狐度  
  10.         $radLat1 = deg2rad($lat1);  
  11.         $radLat2 = deg2rad($lat2);  
  12.         $radLng1 = deg2rad($lng1);  
  13.         $radLng2 = deg2rad($lng2);  
  14.    
  15.         //结果  
  16.         $s = acos(cos($radLat1)*cos($radLat2)*cos($radLng1-$radLng2)+sin($radLat1)*sin($radLat2))*$R;  
  17.    
  18.         //精度  
  19.         $s = round($s* 10000)/10000;  
  20.    
  21.         return  round($s);  
  22.     }  
  23. ?>  

4、在实际应用中,需要从数据库中遍历取出符合条件,以及排序等操作, 

将所有数据取出,然后通过PHP循环对比,筛选符合条件结果,显然性能低下;所以我们利用下Mysql存储函数来解决这个问题吧。 

4.1、创建Mysql存储函数,并对经纬度字段建立索引 
Sql代码   收藏代码
  1. DELIMITER $$  
  2.    
  3. CREATE DEFINER=`root`@`%` FUNCTION `GETDISTANCE`(lat1 DOUBLE, lng1 DOUBLE, lat2 DOUBLE, lng2 DOUBLERETURNS double  
  4.    
  5. READS SQL DATA  
  6.    
  7. DETERMINISTIC  
  8.    
  9. BEGIN  
  10.    
  11. DECLARE RAD DOUBLE;  
  12.    
  13. DECLARE EARTH_RADIUS DOUBLE DEFAULT 6378137;  
  14.    
  15. DECLARE radLat1 DOUBLE;  
  16.    
  17. DECLARE radLat2 DOUBLE;  
  18.    
  19. DECLARE radLng1 DOUBLE;  
  20.    
  21. DECLARE radLng2 DOUBLE;  
  22.    
  23. DECLARE s DOUBLE;  
  24.    
  25. SET RAD = PI() / 180.0;  
  26.    
  27. SET radLat1 = lat1 * RAD;  
  28.    
  29. SET radLat2 = lat2 * RAD;  
  30.    
  31. SET radLng1 = lng1 * RAD;  
  32.    
  33. SET radLng2 = lng2 * RAD;  
  34.    
  35. SET s = ACOS(COS(radLat1)*COS(radLat2)*COS(radLng1-radLng2)+SIN(radLat1)*SIN(radLat2))*EARTH_RADIUS;  
  36.    
  37. SET s = ROUND(s * 10000) / 10000;  
  38.    
  39. RETURN s;  
  40.    
  41. END$$  
  42.    
  43. DELIMITER ;  

4.2、查询SQL 

通过SQL,可设置距离以及排序;可搜索出符合条件的信息,以及有一个较好的排序 
Sql代码   收藏代码
  1. SELECT *,latitude,longitude,GETDISTANCE(latitude,longitude,30.663262,104.071619) AS distance FROM  mb_shop_ext where 1 HAVING distance<1000 ORDER BY distance ASC LIMIT 0,10  


二、方案B 
=================================================================================================

Geohash算法;geohash是一种地址编码,它能把二维的经纬度编码成一维的字符串。 
比如,成都永丰立交的编码是wm3yr31d2524 

优点: 

1、利用一个字段,即可存储经纬度;搜索时,只需一条索引,效率较高 
2、编码的前缀可以表示更大的区域,查找附近的,非常方便。 SQL中,LIKE ‘wm3yr3%’,即可查询附近的所有地点。 
3、通过编码精度可模糊坐标、隐私保护等。 

缺点: 距离和排序需二次运算(筛选结果中运行,其实挺快) 

1、geohash的编码算法 

成都永丰立交经纬度(30.63578,104.031601) 

1.1、纬度范围(-90, 90)平分成两个区间(-90, 0)、(0, 90), 如果目标纬度位于前一个区间,则编码为0,否则编码为1。 
由于30.625265属于(0, 90),所以取编码为1。 
然后再将(0, 90)分成 (0, 45), (45, 90)两个区间,而39.92324位于(0, 45),所以编码为0, 
然后再将(0, 45)分成 (0, 22.5), (22.5, 45)两个区间,而39.92324位于(22.5, 45),所以编码为1, 
依次类推可得永丰立交纬度编码为101010111001001000100101101010。 

1.2、经度也用同样的算法,对(-180, 180)依次细分,(-180,0)、(0,180) 得出编码110010011111101001100000000000 

1.3、合并经纬度编码,从高到低,先取一位经度,再取一位纬度;得出结果 111001001100011111101011100011000010110000010001010001000100 

1.4、用0-9、b-z(去掉a, i, l, o)这32个字母进行base32编码,得到(30.63578,104.031601)的编码为wm3yr31d2524。 
Java代码   收藏代码
  1. 11100 10011 00011 11110 10111 00011 00001 01100 00010 00101 00010 00100 => wm3yr31d2524  
  2.    
  3. 十进制  0   1   2   3   4   5   6   7   8   9   10  11  12  13  14  15  
  4. base32   0   1   2   3   4   5   6   7   8   9   b   c   d   e   f   g  
  5. 十进制  16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31  
  6. base32   h   j   k   m   n   p   q   r   s   t   u   v   w   x   y   z  

2、策略 

1、在纬度和经度入库时,数据库新加一字段geohash,记录此点的geohash值 

2、查找附近,利用 在SQL中 LIKE ‘wm3yr3%’;且此结果可缓存;在小区域内,不会因为改变经纬度,而重新数据库查询 

3、查找出的有限结果,如需要求距离或者排序,可利用距离公式和二维数据排序;此时也是少量数据,会很快的。 

3、PHP基类 

geohash.class.php 
Php代码   收藏代码
  1. <?php  
  2.    
  3. /** 
  4. * Encode and decode geohashes 
  5. * 
  6. */  
  7.    
  8. class Geohash  
  9. {  
  10.     private $coding="0123456789bcdefghjkmnpqrstuvwxyz";  
  11.     private $codingMap=array();  
  12.    
  13.     public function Geohash()  
  14.     {  
  15.         for($i=0; $i<32; $i++)  
  16.         {  
  17.             $this->codingMap[substr($this->coding,$i,1)]=str_pad(decbin($i), 5, "0", STR_PAD_LEFT);  
  18.         }  
  19.    
  20.     }  
  21.    
  22.     public function decode($hash)  
  23.     {  
  24.         $binary="";  
  25.         $hl=strlen($hash);  
  26.         for($i=0; $i<$hl$i++)  
  27.         {  
  28.             $binary.=$this->codingMap[substr($hash,$i,1)];  
  29.         }  
  30.    
  31.         $bl=strlen($binary);  
  32.         $blat="";  
  33.         $blong="";  
  34.         for ($i=0; $i<$bl$i++)  
  35.         {  
  36.             if ($i%2)  
  37.                 $blat=$blat.substr($binary,$i,1);  
  38.             else  
  39.                 $blong=$blong.substr($binary,$i,1);  
  40.    
  41.         }  
  42.    
  43.         $lat=$this->binDecode($blat,-90,90);  
  44.         $long=$this->binDecode($blong,-180,180);  
  45.    
  46.         $latErr=$this->calcError(strlen($blat),-90,90);  
  47.         $longErr=$this->calcError(strlen($blong),-180,180);  
  48.    
  49.         $latPlaces=max(1, -round(log10($latErr))) - 1;  
  50.         $longPlaces=max(1, -round(log10($longErr))) - 1;  
  51.    
  52.         $lat=round($lat$latPlaces);  
  53.         $long=round($long$longPlaces);  
  54.    
  55.         return array($lat,$long);  
  56.     }  
  57.    
  58.     public function encode($lat,$long)  
  59.     {  
  60.         $plat=$this->precision($lat);  
  61.         $latbits=1;  
  62.         $err=45;  
  63.         while($err>$plat)  
  64.         {  
  65.             $latbits++;  
  66.             $err/=2;  
  67.         }  
  68.    
  69.         $plong=$this->precision($long);  
  70.         $longbits=1;  
  71.         $err=90;  
  72.         while($err>$plong)  
  73.         {  
  74.             $longbits++;  
  75.             $err/=2;  
  76.         }  
  77.    
  78.         $bits=max($latbits,$longbits);  
  79.    
  80.         $longbits=$bits;  
  81.         $latbits=$bits;  
  82.         $addlong=1;  
  83.         while (($longbits+$latbits)%5 != 0)  
  84.         {  
  85.             $longbits+=$addlong;  
  86.             $latbits+=!$addlong;  
  87.             $addlong=!$addlong;  
  88.         }  
  89.    
  90.         $blat=$this->binEncode($lat,-90,90, $latbits);  
  91.    
  92.         $blong=$this->binEncode($long,-180,180,$longbits);  
  93.    
  94.         $binary="";  
  95.         $uselong=1;  
  96.         while (strlen($blat)+strlen($blong))  
  97.         {  
  98.             if ($uselong)  
  99.             {  
  100.                 $binary=$binary.substr($blong,0,1);  
  101.                 $blong=substr($blong,1);  
  102.             }  
  103.             else  
  104.             {  
  105.                 $binary=$binary.substr($blat,0,1);  
  106.                 $blat=substr($blat,1);  
  107.             }  
  108.             $uselong=!$uselong;  
  109.         }  
  110.    
  111.         $hash="";  
  112.         for ($i=0; $i<strlen($binary); $i+=5)  
  113.         {  
  114.             $n=bindec(substr($binary,$i,5));  
  115.             $hash=$hash.$this->coding[$n];  
  116.         }  
  117.    
  118.         return $hash;  
  119.     }  
  120.    
  121.     private function calcError($bits,$min,$max)  
  122.     {  
  123.         $err=($max-$min)/2;  
  124.         while ($bits--)  
  125.             $err/=2;  
  126.         return $err;  
  127.     }  
  128.    
  129.     private function precision($number)  
  130.     {  
  131.         $precision=0;  
  132.         $pt=strpos($number,'.');  
  133.         if ($pt!==false)  
  134.         {  
  135.             $precision=-(strlen($number)-$pt-1);  
  136.         }  
  137.    
  138.         return pow(10,$precision)/2;  
  139.     }  
  140.    
  141.     private function binEncode($number$min$max$bitcount)  
  142.     {  
  143.         if ($bitcount==0)  
  144.             return "";  
  145.         $mid=($min+$max)/2;  
  146.         if ($number>$mid)  
  147.             return "1".$this->binEncode($number$mid$max,$bitcount-1);  
  148.         else  
  149.             return "0".$this->binEncode($number$min$mid,$bitcount-1);  
  150.     }  
  151.    
  152.     private function binDecode($binary$min$max)  
  153.     {  
  154.         $mid=($min+$max)/2;  
  155.    
  156.         if (strlen($binary)==0)  
  157.             return $mid;  
  158.    
  159.         $bit=substr($binary,0,1);  
  160.         $binary=substr($binary,1);  
  161.    
  162.         if ($bit==1)  
  163.             return $this->binDecode($binary$mid$max);  
  164.         else  
  165.             return $this->binDecode($binary$min$mid);  
  166.     }  
  167. }  
  168. ?>  

三、测试 
Php代码   收藏代码
  1. <?php  
  2.    
  3. require_once('Mysql.class.php');  
  4. require_once('geohash.class.php');  
  5.    
  6. //mysql  
  7. $conf = array(  
  8.    
  9.     'host' => '127.0.0.1',  
  10.     'port' => 3306,  
  11.     'user' => 'root',  
  12.     'password' => '123456',  
  13.     'database' => 'mocube',  
  14.     'charset' => 'utf8',  
  15.     'persistent' => false  
  16. );  
  17.    
  18. $mysql = new Db_Mysql($conf);  
  19. $geohash=new Geohash;  
  20.    
  21. //经纬度转换成Geohash  
  22. /* 
  23.   
  24. $sql = 'select shop_id,latitude,longitude from mb_shop_ext'; 
  25.   
  26. $data = $mysql->queryAll($sql); 
  27.   
  28. foreach($data as $val) 
  29. { 
  30.   
  31.   $geohash_val = $geohash->encode($val['latitude'],$val['longitude']); 
  32.   
  33.   $sql = 'update mb_shop_ext set geohash= "'.$geohash_val.'" where shop_id = '.$val['shop_id']; 
  34.   
  35.   echo $sql; 
  36.   
  37.   $re = $mysql->query($sql); 
  38.   
  39.   var_dump($re); 
  40.   
  41. } 
  42. */  
  43.    
  44. //获取附近的信息  
  45. $n_latitude = $_GET['la'];  
  46. $n_longitude = $_GET['lo'];  
  47.    
  48. //开始  
  49. $b_time = microtime(true);  
  50.    
  51. //方案A,直接利用数据库存储函数,遍历排序  
  52. /* 
  53. $sql = 'SELECT *,latitude,longitude,GETDISTANCE(latitude,longitude,'.$n_latitude.','.$n_longitude.') AS distance FROM  mb_shop_ext where 1 HAVING distance<1000 ORDER BY distance ASC'; 
  54.   
  55. $data = $mysql->queryAll($sql); 
  56.   
  57. //结束 
  58. $e_time = microtime(true); 
  59.   
  60. echo $e_time - $b_time; 
  61.   
  62. var_dump($data); 
  63. exit; 
  64. */  
  65.    
  66. //方案B geohash求出附近,然后排序  
  67.    
  68. //当前 geohash值  
  69. $n_geohash = $geohash->encode($n_latitude,$n_longitude);  
  70.    
  71. //附近  
  72. $n = $_GET['n'];  
  73. $like_geohash = substr($n_geohash, 0, $n);  
  74.    
  75. $sql = 'select * from mb_shop_ext where geohash like "'.$like_geohash.'%"';  
  76.    
  77. echo $sql;  
  78.    
  79. $data = $mysql->queryAll($sql);  
  80.    
  81. //算出实际距离  
  82. foreach($data as $key=>$val)  
  83. {  
  84.     $distance = getDistance($n_latitude,$n_longitude,$val['latitude'],$val['longitude']);  
  85.    
  86.     $data[$key]['distance'] = $distance;  
  87.    
  88.     //排序列  
  89.     $sortdistance[$key] = $distance;  
  90. }  
  91.    
  92. //距离排序  
  93. array_multisort($sortdistance,SORT_ASC,$data);  
  94.    
  95. //结束  
  96. $e_time = microtime(true);  
  97.    
  98. echo $e_time - $b_time;  
  99.    
  100. var_dump($data);  
  101.    
  102. //根据经纬度计算距离 其中A($lat1,$lng1)、B($lat2,$lng2)  
  103. function getDistance($lat1,$lng1,$lat2,$lng2)  
  104. {  
  105.     //地球半径  
  106.     $R = 6378137;  
  107.    
  108.     //将角度转为狐度  
  109.     $radLat1 = deg2rad($lat1);  
  110.     $radLat2 = deg2rad($lat2);  
  111.     $radLng1 = deg2rad($lng1);  
  112.     $radLng2 = deg2rad($lng2);  
  113.    
  114.     //结果  
  115.     $s = acos(cos($radLat1)*cos($radLat2)*cos($radLng1-$radLng2)+sin($radLat1)*sin($radLat2))*$R;  
  116.    
  117.     //精度  
  118.     $s = round($s* 10000)/10000;  
  119.    
  120.     return  round($s);  
  121. }  
  122. ?>  


四、总结 

方案B的亮点在于: 
1、搜索结果可缓存,重复使用,不会因为用户有小范围的移动,直接穿透数据库查询。 
2、先缩小结果范围,再运算、排序,可提升性能。 

254条记录,性能对比, 

在实际应用场景中,方案B数据库搜索可内存缓存;且如数据量更大,方案B结果会更优。 

方案A: 
0.016560077667236 
0.032402992248535 
0.040318012237549 

方案B 
0.0079810619354248 
0.0079669952392578 
0.0064868927001953 

五、其他 

两种方案,根据应用场景以及负载情况合理选择,当然推荐方案B; 
不管哪种方案,都记得,给列加上索引,利于数据库检索。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值