简易的Python脚本，获取指定网站截图的函数

最新推荐文章于 2024-04-21 23:45:28 发布

leo-minimalist

最新推荐文章于 2024-04-21 23:45:28 发布

阅读量352

点赞数

文章标签： python 前端爬虫

本文链接：https://blog.csdn.net/weixin_44297276/article/details/129832101

版权

# 获取网站截图
def wayback_machine(url, output_file=None):
# 构建互联网档案馆 Wayback Machine 的 API URL
api_url = "http://web.archive.org/cdx/search/cdx?url=*.{}/*&output=json&fl=original&collapse=urlkey".format(url)

# 发送 GET 请求到 API
response = requests.get(api_url)

# 解析 JSON 响应
if response.status_code == 200:
data = json.loads(response.text)

# 检查是否有网站截图
if len(data) > 1:
print("\n🔎 网站截图可用 🔍\n")
urls = []
for item in data[1:]:
url = item[0]
urls.append(url)
print(url)
# 如果需要，将 URL 保存到文本文件中
if output_file is not None:
with open(output_file, "w") as f:
for url in urls:
f.write(url + "\n")
print("\nURL 已保存到文件 {}。".format(output_file))
else:
print("\n没有可用的网站截图。")
else:
print("\/无法访问互联网档案馆 Wayback Machine。")

# 定义命令行参数
parser = argparse.ArgumentParser()
parser.add_argument("url", help="输入要检查截图的网站名称")
parser.add_argument("-o", "--output", help="保存网站截图 URL 的文件名")
args = parser.parse_args()

# 调用 wayback_machine 函数
wayback_machine(args.url, args.output)

其中 <url>是要获取截图的网站名称，<output_file>是可选参数，用于指定保存截图 URL 的文件名。

有不同的方式可以加q讨论：99270043

leo-minimalist

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
简易的Python脚本，获取指定网站截图的函数

".format(output_file))parser.add_argument("-o", "--output", help="保存网站截图 URL 的文件名")其中是要获取截图的网站名称，是可选参数，用于指定保存截图 URL 的文件名。parser.add_argument("url", help="输入要检查截图的网站名称")print("\n🔎 网站截图可用 🔍\n")print("\n没有可用的网站截图。# 这是一个获取网站截图的函数。
复制链接

扫一扫