使用Edge扩展工具(GoFullPage)实现整页面截图或生成PDF文件

如果在浏览网页时,有需要整个页面截图或导出PDF文件的需求,这里分享一个Edge浏览器的扩展插件:GoFullPage。

这个工具可以一键实现页面从上到下滚动并截取。

 一、打开“管理扩展”(edge://extensions/),打开获取Microsoft Edge扩展。

 二、搜索GofullPage,获取扩展。

 三、打开要保存的页面,使用GofullPage截图。

 四、截图后可以选择下载为图片或PDF文件。

要利用Selenium和Microsoft Edge浏览器爬取使用JS跳转的页面,可以按照以下步骤: 1. 安装Selenium和Edge浏览器驱动程序 2. 导入Selenium和Edge驱动程序的库 ```python from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.edge.service import Service as EdgeService ``` 3. 创建一个Edge浏览器实例 ```python # 创建Edge浏览器实例 edge_service = EdgeService('C:/Program Files (x86)/Microsoft/Edge/Application/msedgedriver.exe') # Edge驱动程序的路径 edge_options = webdriver.EdgeOptions() edge_options.use_chromium = True edge_options.add_argument('--disable-extensions') edge_options.add_argument('--profile-directory=Default') edge_options.add_argument("--incognito") edge_options.add_argument("--disable-plugins-discovery") edge_options.add_argument("--start-maximized") edge_options.add_argument("--disable-blink-features=AutomationControlled") driver = webdriver.Edge(service=edge_service, options=edge_options) ``` 4. 访问目标网站并等待页面加载完成 ```python # 访问目标网站 driver.get("https://example.com") # 等待页面加载完成 driver.implicitly_wait(10) ``` 5. 查找页面元素并执行JS脚本跳转到目标页面 ```python # 查找页面元素 element = driver.find_element_by_id("element_id") # 执行JS脚本跳转到目标页面 driver.execute_script("arguments[0].click();", element) ``` 6. 等待目标页面加载完成并获取页面内容 ```python # 等待目标页面加载完成 driver.implicitly_wait(10) # 获取页面内容 page_source = driver.page_source ``` 7. 关闭浏览器实例 ```python # 关闭浏览器实例 driver.quit() ``` 以上就是利用Selenium和Edge浏览器爬取使用JS跳转的页面的步骤。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值