利用Selenium爬取百度地图api数据

最新推荐文章于 2024-08-23 16:52:47 发布

bingilm

最新推荐文章于 2024-08-23 16:52:47 发布

阅读量1.6k

点赞数

文章标签： python 爬虫

本文链接：https://blog.csdn.net/bingilm/article/details/82861042

版权

百度地图api为我们提供了建筑等的地理位置查询。但是不能批量获取诸如“地铁站”的地理位置信息。借助Selenium可爬取地理位置信息并保存到txt文件中。

# -*- coding:utf-8 -*-

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time

#共37页进行爬虫
driver = webdriver.Firefox()
driver.get('http://api.map.baidu.com/lbsapi/getpoint/index.html')
time.sleep(5)
element1 = driver.find_element_by_link_text("更换城市")
element1.click()
element2 = driver.find_element_by_link_text("上海")
element2.click()
time.sleep(5)
element3 = driver.find_element_by_id("localvalue")
element3.send_keys("地铁站")
element3.send_keys(Keys.RETURN)     #此步为关键格式！！！这样html内容才会改变
time.sleep(2)

element = ''
for i in range(37):
    element += driver.find_element_by_id("txtPanel").text
    loc = driver.find_element_by_link_text("下一页")
    loc.click()
    time.sleep(5)
    i += 1

file_handle = open("C:\\Users\\metro.txt",mode = 'w+')
file_handle.write(element)
file_handle.close()