在实际应用中,我们常常需要获取某些地区的一类节点,如在做地区物流节点分析时,需要获取该地区所有物流节点的地址、经纬度等信息。本文主要借助百度开发者工具中的api完成。话不多说上代码吧。
import pandas as pd
import requests
import json
api_key = "********" # 通过百度开发者工具获取的自己的api
endpoint = "http://api.map.baidu.com/place/v2/search" # 需要连接的百度api
params = {
"query": "广元市", # 搜索地区(大范围)
"region": "广元市", # 搜索地区(小范围)
"output": "json", # 数据输出格式
"ak": api_key # 接口api_kay
}
# 向指定地址发送接口查询申请
response = requests.get(endpoint, params=params)
# 加载数据
response_json = json.loads(response.text)
# 解析获取的经纬度
city_lat = response_json["results"][0]["location"]["lat"]
city_lng = response_json["results"][0]["location"]["lng"]
# 定义关键词查询接口
def get_locations(keywords):
results = []
for k in keywords:
params["query"] = "广元市 " + k
response = requests.get(endpoint, params=params)
response_json = json.loads(response.text)
result = response_json["results"]
results.extend(result)
return results
# 定义需要查询的字段(如物流配送中心相关,关键词根据实际调整)
keywords = []
key1 = ['物流中心', '配送中心', '快递转运点', '仓库', '菜鸟驿站']
keywords.extend(key1)
keywords = list(set(keywords))
# 调用函数获取查询结果
results = get_locations(keywords)
print(results)
# 解析数据结果
df = pd.DataFrame(results)
df = df.drop(columns=["detail", "uid", "telephone"]) # "street_id",
df = df.sort_values(by=['area'])
df['lat'] = df['location'].apply(lambda x: x['lat'])
df['lng'] = df['location'].apply(lambda x: x['lng'])
del df['location']
df = df.drop_duplicates(subset=['name', 'address']).reset_index(drop=True)
print('累计获取数据条数:', len(df))
df = df.reindex(columns = ['name','address','province','city','area','lng','lat'])
df.columns = ['名称', '地址', '省份', '城市', '地区', '经度', '纬度']
df.index = df.index + 1
print(df)
# 数据输出为Excel(方便查阅和后续解析)
df.to_excel('某地区物流节点.xlsx')
这里的主要思路其实就是调用百度api做地理信息位置查询,其实只要能够获取到信息,后续的解析步骤根据实际需求获取或者调整即可。