多的不说,直接上码,需要更改的地方我给大家打上# ***,改成自己的直接用即可:
两种方法:
1 利用geopy
首先导入包,并读取数据
import pandas as pd
from geopy.geocoders import Nominatim
from geopy.exc import GeocoderTimedOut
data = pd.read_excel('这里替换成自己的数据.xlsx') # ***
初始化nominatim服务,不用管,加上就即可
# 初始化 geopy 的 Nominatim 服务
geolocator = Nominatim(user_agent="geoapiExercises")
定义逆地理编码函数,这里language使用的是zh,要是想用英文,可以换成en
# 定义逆地理编码函数
def reverse_geocode(lat, lon):
try:
location = geolocator.reverse((lat, lon), language='zh')
return location.address
except GeocoderTimedOut:
return reverse_geocode(lat, lon)
apply一下即可
# 为每个坐标对应用逆地理编码
data['address'] = data.apply(lambda row: reverse_geocode(row['latitude'], row['longitude']), axis=1)
最后导出即可
data.to_excel("导出.xlsx") # ***
导出格式大概就是这样,这个结果是我进行了一些调整,原本应该是国家,省,市等等
2 利用高德API
这个方法更适用于中国宝宝体质,对中国地区更加精确,直接上码!
导入包,加载数据:
import pandas as pd
import requests
# 加载数据
data = pd.read_excel("替换成自己的文件xlsx") # ***
获取高德密钥(去高德开放平台,注册一个账户,进入控制台,进去应用管理,创建应用即可获取key)
# 高德地图API密钥
key = '把密钥复制到单引号内即可' # ***
定义逆地理编码函数:
# 定义逆地理编码函数,这里我给拆开了,每个信息作为单独的一列,地址+省份+城市+区县+城镇+乡村+街道+门牌号码+POI
def reverse_geocode_amap(lat, lon):
url = f'https://restapi.amap.com/v3/geocode/regeo?key={key}&location={lon},{lat}&extensions=all'
response = requests.get(url)
if response.status_code == 200:
result = response.json()
if result['status'] == '1' and result['regeocode']:
address_component = result['regeocode']['addressComponent']
formatted_address = result['regeocode']['formatted_address']
province = address_component['province']
city = address_component['city']
district = address_component['district']
township = address_component.get('township', '')
neighborhood = address_component.get('neighborhood', {}).get('name', '')
street = address_component.get('streetNumber', {}).get('street', '')
number = address_component.get('streetNumber', {}).get('number', '')
pois = result['regeocode'].get('pois', [])
poi_names = [poi['name'] for poi in pois]
return formatted_address, province, city, district, township, neighborhood, street, number, '; '.join(poi_names)
return None, None, None, None, None, None, None, None, None
# 为每个坐标对应用逆地理编码
address_components = data.apply(lambda row: reverse_geocode_amap(row['latitude'], row['longitude']), axis=1)
# 将结果分解为单独的列
data[['formatted_address', 'province', 'city', 'district', 'township', 'neighborhood', 'street', 'number', 'poi']] = pd.DataFrame(address_components.tolist(), index=data.index)
导出结果
# 保存结果
data.to_excel("导出.xlsx") # ***
看一下最后结果:大概就是这个样子