1.前言
在日常的数据分析过程中,我们可能会遇到一些关于字符串类型的地址信息,由于录入的地址信息良莠不齐,我们在进行地址处理时就会变得麻烦。为了能够方便的进行地址的处理,这里提供一个地址的处理方法。
2.根据字符串形式的地址信息获取经纬
2.1 选择合适的地图api接口
目前支持地图api接口的网站有很多,在这里以百度地图为例:
步骤1.先去百度地图开发平台,注册成为开发者;
步骤2.在应用管理下创建自己的应用;
步骤3.输入必要的信息,然后创建完成;
2.2 使用python调用api接口
先将官方文档的链接放在这里:https://lbsyun.baidu.com/index.php?title=webapi/guide/webservice-geocoding
调用实例代码如下:
import json
from urllib.request import urlopen, quote
import requests
def getlnglat(address):
url = 'http://api.map.baidu.com/geocoding/v3/'
output = 'json'
ak = 'F5BrbxjbjGMMC3fGDMXK1q9' # 百度地图AK(自己创建好的应用里有,这里直接复制过来即可),
address = quote(address) # 由于本文地址变量为中文,为防止乱码,先用quote进行编码
uri = url + '?' + 'address=' + address + '&output=' + output + '&ak=' + ak
req = urlopen(uri)
# res = req.read().decode() 这种方式也可以,和下面的效果一样,都是返回json格式
res=requests.get(uri).text
temp = json.loads(res) # 将字符串转化为json
try:
lat = temp.get('result').get('location').get('lat')
lng = temp.get('result').get('location').get('lng')
str_lat_lng=str(lat)+','+str(lng)
except Exception as e:
str_lat_lng=' , '
return str_lat_lng # 纬度 latitude,经度 longitude
调用方法如下:
address="四川省南充市顺庆区新世纪百货1楼"
getlnglat(address)
调用结果截图:
3.计算两个经纬度之间的直线距离
按照上面的方法,我们可以成功匹配到经纬度,有时候我们可能需要来计算两个经纬度之间的距离。
import numpy as np
import pandas as pd
import math
#lat lon - > distance
# 计算经纬度之间的距离,单位为千米
EARTH_REDIUS = 6378.137
def rad(d):
return d * np.pi / 180.0
def getDistance(lat1, lng1, lat2, lng2):
#lat表示维度,lng表示经度
radLat1 = rad(lat1)
radLat2 = rad(lat2)
a = radLat1 - radLat2
b = rad(lng1) - rad(lng2)
s = 2 * math.asin(math.sqrt(math.pow(math.sin(a/2), 2) + math.cos(radLat1) * math.cos(radLat2) * math.pow(math.sin(b/2), 2)))
#d的单位为千米
d = s * EARTH_REDIUS
return d
调用方法及截图: