python 打开网页并截图_python自动获得网页上的所有超链接并全部截图

最新推荐文章于 2023-08-09 18:22:47 发布

drapeaublanc

最新推荐文章于 2023-08-09 18:22:47 发布

阅读量1.7k

点赞数

文章标签： python 打开网页并截图

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33478575/article/details/114914026

版权

本文介绍如何使用Python的selenium和BeautifulSoup库自动化打开网页并获取所有超链接，然后逐一截图保存。首先安装所需模块，接着编写代码访问网页，滚动截取全屏图片，并存储到本地。通过遍历HTML中的a标签，避免重复截图，实现对多个网页的截图功能。

摘要由CSDN通过智能技术生成

需要安装python的selenium模块，这是一个浏览器自动化的框架。然后我是使用chrome浏览器的，所以还需要安装一个chromedriver。还有一个爬虫框架bs4。

selenium和bs4直接用pip安装，在终端下执行：

pip install selenium

pip install Beautifulsoup4

chromedriver安装参考这个网址：

https://www.cnblogs.com/technologylife/p/5829944.html

然后进入正文，总的流程就是解析网址的html，取出超链接逐个访问，然后截图到本地的文件夹里，目前实现的版本还没有分类，只是把图片全部存到一个文件夹里。

总的代码如下：

from selenium import webdriver

from selenium.webdriver.chrome.options import Options

import requests

from bs4 import BeautifulSoup

import time

i=0 #目前暂时先用一个计数来表示图片的文件名

def getScreenShot(url):

'''

此函数用于根据url访问网页，并截图到本地文件夹

'''

global i #全局变量

chrome_options = Options()

chrome_options.add_argument('--headless')

chrome_options.add

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。