使用 selenium 爬取谷歌地图的经纬度

虽然没几个人看 但是还是写一下

代码仅供学习分享,禁止用于盈利或其他违法犯罪事件
The code is only for learning and sharing, and is not allowed to be used for profit or other illegal or criminal activities

思路 :
谷歌搜索地名的时候经纬度会出现在url中,所以我们可以利用这个来获取经纬度
由于谷歌在搜索地址的时候有可能因为网络原因 url依旧显示的是你电脑所在的地址
所以必须要先获取你电脑所在的地址。方便后面进行比对。

code:

# 导入需要的包
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.support.ui import WebDriverWait
import time
import sys
import re
import os
import csv
import numpy as np
# print(sys.path)
# help(webdriver)




def getLandL(add):
    L1Mark, L2Mark = .0, .0  # 设置两个变量 装载自己电脑所在的经纬度
    for no in range(10):
        options = Options()
        options.add_argument('--headless')    # 不打开浏览器
        options.add_argument('--disable-gpu')  # 禁用GPU硬件加速
        options.add_argument(
            'user-agent="Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.2pre) Gecko/20070215 K-Ninja/2.1.1"')  # 添加访问头
        # options.add_argument('proxy-server="60.13.42.109:9999"')    # 添加代理
        driver = webdriver.Chrome(options=options)  # 使用驱动配置
        driver.set_window_size(1920, 1080)
        
        # 先獲取电脑本身的經緯度 以防出錯
        driver.get("https://www.google.com.hk/maps/place/")
        time.sleep(8)  # 等待时间
        python_button = driver.find_elements_by_xpath("//*[@id=\"searchbox-searchbutton\"]")[0]
        python_button.click()
        time.sleep(8)  # 等待时间
        getUrl = driver.current_url
        
        
        # 獲取需要爬取的地址
        element = re.findall("https://www.google.com.hk/maps/@(\d+.\d+).*?(\d+.\d+)", getUrl, re.S)
  
        if element != []:
            L1Mark, L2Mark = float(element[0][0]), float(element[0][1])
            
         
        driver.get("https://www.google.com.hk/maps/place/" + add)
        driver.implicitly_wait(15)  # 等待时间
        
        
        
        
        for timerOut in range(5):
            python_button = driver.find_elements_by_xpath("//*[@id=\"searchbox-searchbutton\"]")[0]
            python_button.click()
            time.sleep(8)
            getUrl = driver.current_url
            element = re.findall("https://www.google.com.hk/maps/.*?/.*?@(\d+.\d+).*?(\d+.\d+)", getUrl, re.S)

            if element != []:
                L1End, L2End = float(element[0][0]), float(element[0][1])  
                L1, L2 = float(element[0][0]), float(element[0][1])  
                if ((L1Mark != L1 and L2Mark != L2) or ( no >= 7 and timerOut >= 3) ):
                    driver.close()
                    return L1, L2
        
        driver.close()
        time.sleep(20)
    
    print(L1End, L2End)
    return [L1End, L2End]
# 调用只需要把你想要的爬的address写入就可以了
getLandL(address)

Reference :
爬虫究竟是合法还是违法的?

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值