使用selenium进行多窗口处理demo

最新推荐文章于 2023-10-17 18:44:17 发布

走在下雨天的人

最新推荐文章于 2023-10-17 18:44:17 发布

阅读量1.3k

点赞数

分类专栏：爬虫 python

本文链接：https://blog.csdn.net/qq_42988748/article/details/83622861

版权

使用selenium需要启动浏览器，当然必要的环境肯定要支持啦，做爬虫效率也没有框架来的快，但是我喜欢啊（调皮）

这是一个可以进行多窗口抓取的demo，可以根据自己的需求进行更改

from selenium import webdriver
from selenium.webdriver.common.by import By

# WebDriverWait 库，负责循环等待
from selenium.webdriver.support.ui import WebDriverWait
# expected_conditions 类，负责条件出发
from selenium.webdriver.support import expected_conditions as EC
from lxml import etree
import time


class LogouSpider():
    def __init__(self):
        self.driver = webdriver.Chrome()
        self.url = 'https://www.baidu.com/'

    def run(self):
        self.driver.get(self.url)
        url = 'http://news.baidu.com'
        source = self.parse_detail(url)

    def parse_detail(self, url):
        self.driver.execute_script('window.open("%s")' % url)
        self.driver.switch_to.window(self.driver.window_handles[1])
        #等待页面元素加载，不能是文本信息
        WebDriverWait(self.dri

最低0.47元/天解锁文章

走在下雨天的人

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
使用selenium进行多窗口处理demo

使用selenium需要启动浏览器，当然必要的环境肯定要支持啦，做爬虫效率也没有框架来的快，但是我喜欢啊（调皮）这是一个可以进行多窗口抓取的demo，可以根据自己的需求进行更改from selenium import webdriverfrom selenium.webdriver.common.by import By# WebDriverWait 库，负责循环等待from sele...
复制链接

扫一扫