分析百度地图API帮助文档:http://lbsyun.baidu.com/
地点检索服务 http://lbsyun.baidu.com/index.php?title=webapi/guide/webservice-placeapi
地点检索服务(又名Place API)是一类Web API接口服务;
服务提供多种场景的地点(POI)检索功能,包括城市检索、圆形区域检索、矩形区域检索。开发者可通过接口获取地点(POI)基础或详细地理信息。
注意:地点检索服务适用于【XX大厦】、【XX小区】等POI地点名称的检索,若需要检索结构化地址,如【北京市海淀区上地十街十号】,则推荐使用地理编码服务。
api请求分析其json数据:http://api.map.baidu.com/place/v2/search?query=ATM机&tag=银行®ion=北京&output=json&ak=您的ak //GET请求
通过分析发现"result" 存了xiang要的信息,若要获取所有的信息,在api添加变量:page_size:一页显示多少数据最多20个,page_num:翻页
http://api.map.baidu.com/place/v2/search?query=旅游景点&page_size=20&page_num=1®ion=大理市&output=json&ak=你的ak
这样就能获得所有的地理信息数据,接下来代码:
#没有的包自行下载
import requests
import json
import time
import xlwt
#没有的包自行下载
city = input("输入城市") # 输入台风的编号
serch = input("输入要查询的内容") # 输入搜索内容
keybaidu="你的key"
title = [] # 标题
address = [] #详细地址
tel = [] #电话
lat = [] #经度
lng = [] #纬度
index=0
while True:
num=str(index)
# 含时间戳的url,请求头
url ="http://api.map.baidu.com/place/v2/search?query="+serch+"&page_size=20&page_num="+num+"®ion="+city+"&output=json&ak="+keybaidu+""
r = requests.get(url)
print(r.text) #输出json数据
a = json.loads(r.text) # 解析json文件,strict=False
print(a["status"])
if a["status"]==401:#401错误跳出循环
continue
else:
print(len(a["results"]))
if len(a["results"])==0:
break
else:
for i in range(len(a["results"])):
if ("telephone" in a["results"][i]):
telephone=a["results"][i]["telephone"]
else:
telephone="无"
title.append(a["results"][i]["name"])
address.append(a["results"][i]["address"])
tel.append(telephone)
lat.append(a["results"][i]["location"]["lat"])
lng.append(a["results"][i]["location"]["lng"])
title=title
address=address
tel=tel
lat=lat
lng=lng
index=index+1
time.sleep(1.5) #1.5s执行一次 防止并发超额,但也有可能并发超额 不知如何处理
f = xlwt.Workbook() # 创建工作簿
sheet1 = f.add_sheet(u'sheet1', cell_overwrite_ok=True) # 创建sheet
j=0
for title1,address1,tel1,lat1,lng1\
in zip(title,address,tel,lat,lng):
sheet1.write(j,0,title1);sheet1.write(j,1,address1);sheet1.write(j,2,tel1);sheet1.write(j,3,lat1);sheet1.write(j,4,lng1);
j = j+1
f.save("F:\百度地图"+city+""+serch+".xls")#保存文件,
运行结果:
有不完善地方没有解决并发超额,可以将while循环改成for循环规定只循环多少下,一次是二十条数据;只爬了名称 经纬度,address和电话号码,其他的可以直接添加变量:
append(a["results"][i]["你要的"])
over!!!