目前公司开的线下店铺有这麽一个要求:需要知道店铺附近1000米内是否存在中小学,以供后续的业务逻辑操作。
数据前提:大数据的同学已经把公司将要入驻和已经入住的城市的中小学数据通过爬虫将数据存放到mongodb中。所以需要在mongodb中查询指定店铺所在经纬度的一公里范围内的学校信息。
而mongodb正好提供了这种地理经纬度搜索的能力,只要数据符合指定的结构,给要搜索的字段加上特定的索引,即可轻松完成上面的业务能力。
这里需要知道一些基础知识:
地理空间数据
在MongoDB中,可以将地理空间数据存储为 GeoJSON对象 或 传统坐标对 。
以上两种数据都在何种情况下使用?
- GeoJSON对象:要计算类球体上的几何体,位置数据应存储为GeoJSON对象。
- 传统坐标对:要计算欧几里得平面上的距离,位置数据应存储为传统坐标对,并使用2d索引。(将数据转换为GeoJSON Point类型后,并通过2dsphere索引后传统坐标对也支持球面曲面计算。)
那二者的数据都长甚麽样?数据结构是怎样的?
1.GeoJSON对象数据结构:这里我们只以类型为点的数据举例(type:point),这个也最常用。GeoJSON数据结构根据type不同分为几类,详情可以看这里去官网了解:GeoJSON Objects¶ 。
下面是我存在mongodb中的表数据,注意下面数据中的字段:loc既满足这种类型。loc字段需要指定索引为:2dsphere
{
"address" : "南京 禄口国际机场","loc" : {
"type": "Point", "coordinates": [118.783799,31.979234]}}
{
"address" : "南京 浦口公园","loc" : {
"type": "Point", "coordinates": [118.639523,32.070078]}}
{
"address" : "南京 火车站","loc" : {
"type": "Point", "coordinates": [118.803032,32.09248]}}
{
"address" : "南京 新街口","loc" : {
"type": "Point", "coordinates": [118.790611,32.047616]}}
{
"address" : "南京 张府园","loc" : {
"type": "Point", "coordinates": [118.790427,32.03722]}}
{
"address" : "南京 三山街","loc" : {
"type": "Point", "coordinates": [118.788135,32.029064]}}
{
"address" : "南京 中华门","loc" : {
"type": "Point", "coordinates": [118.781161