Python selenium 批量通过地点名字获取详细地址并保存到excel

kidd_s

已于 2023-06-07 17:33:23 修改

阅读量326

点赞数

于 2023-06-07 17:26:11 首次发布

本文链接：https://blog.csdn.net/qq_40661145/article/details/131092432

版权

# coding=utf-8
from openpyxl import load_workbook
# -*- coding: utf-8 -*-
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException, NoSuchElementException, WebDriverException
import time
from bs4 import BeautifulSoup


def coordinate():
    # 创建Chrome浏览器驱动对象
    options = webdriver.ChromeOptions()
    options.add_argument('--headless')  # 设置不打开浏览器窗口执行
    driver = webdriver.Chrome(options=options)

    driver.get('http://api.map.baidu.com/lbsapi/getpoint/index.html')
    # 显式等待，设置timeout
    wait = WebDriverWait(driver, 1)
    # 判断输入框是否加载
    input = wait.until(
        EC.presence_of_element_located(
            (By.CSS_SELECTOR, '#localvalue')))
    # 判断搜索按钮是否加载
    submit = wait.until(
        EC.element_to_be_clickable(
            (By.CSS_SELECTOR, '#localsearch')))

    # workbook加载
    wb = load_workbook(r'获取地址\地点list.xlsx',
                       data_only=True)
    ws = wb.active
    # 遍历每一行
    rows = []
    for row in ws.iter_rows():
        rows.append(row)
    wb = load_workbook(r'\获取医院地址\Hostpital.xlsx')
    ws = wb.active
    data = []
    for i in range(0, ws.max_row):
        input.clear()
        input.send_keys(rows[i][0].value)
        submit.click()
        time.sleep(1)
        try:
            # 等待坐标
            wait.until(
                EC.presence_of_element_located(
                    (By.CSS_SELECTOR, '#no_0')))
        except TimeoutException:
            print(rows[i][0].value, ':百度地图查不到地址')
            continue
        # 获取网页文本，提取经纬度
        source = driver.page_source
        soup = BeautifulSoup(source, 'lxml')

        i = 0
        for li in soup.select('ul.local_s > li'):
            print(li.get_text())
            data.append(li.get_text())
            i += 1
            if i > 0:
                break
    ws.append(data)
    wb.save(r'获取地址\地址list.xlsx')
    # 关闭浏览器驱动
    driver.close()


coordinate()