简易的Python脚本,获取指定网站截图的函数

# 获取网站截图
def wayback_machine(url, output_file=None):
    # 构建互联网档案馆 Wayback Machine 的 API URL
    api_url = "http://web.archive.org/cdx/search/cdx?url=*.{}/*&output=json&fl=original&collapse=urlkey".format(url)

    # 发送 GET 请求到 API
    response = requests.get(api_url)

    # 解析 JSON 响应
    if response.status_code == 200:
        data = json.loads(response.text)

        # 检查是否有网站截图
        if len(data) > 1:
            print("\n🔎 网站截图可用 🔍\n")
            urls = []
            for item in data[1:]:
                url = item[0]
                urls.append(url)
                print(url)
            # 如果需要,将 URL 保存到文本文件中
            if output_file is not None:
                with open(output_file, "w") as f:
                    for url in urls:
                        f.write(url + "\n")
                print("\nURL 已保存到文件 {}。".format(output_file))
        else:
            print("\n没有可用的网站截图。")
    else:
        print("\/无法访问互联网档案馆 Wayback Machine。")

# 定义命令行参数
parser = argparse.ArgumentParser()
parser.add_argument("url", help="输入要检查截图的网站名称")
parser.add_argument("-o", "--output", help="保存网站截图 URL 的文件名")
args = parser.parse_args()

# 调用 wayback_machine 函数
wayback_machine(args.url, args.output)

其中 <url>是要获取截图的网站名称,<output_file>是可选参数,用于指定保存截图 URL 的文件名。

有不同的方式可以加q讨论:99270043

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值