# 获取网站截图
def wayback_machine(url, output_file=None):
# 构建互联网档案馆 Wayback Machine 的 API URL
api_url = "http://web.archive.org/cdx/search/cdx?url=*.{}/*&output=json&fl=original&collapse=urlkey".format(url)
# 发送 GET 请求到 API
response = requests.get(api_url)
# 解析 JSON 响应
if response.status_code == 200:
data = json.loads(response.text)
# 检查是否有网站截图
if len(data) > 1:
print("\n🔎 网站截图可用 🔍\n")
urls = []
for item in data[1:]:
url = item[0]
urls.append(url)
print(url)
# 如果需要,将 URL 保存到文本文件中
if output_file is not None:
with open(output_file, "w") as f:
for url in urls:
f.write(url + "\n")
print("\nURL 已保存到文件 {}。".format(output_file))
else:
print("\n没有可用的网站截图。")
else:
print("\/无法访问互联网档案馆 Wayback Machine。")
# 定义命令行参数
parser = argparse.ArgumentParser()
parser.add_argument("url", help="输入要检查截图的网站名称")
parser.add_argument("-o", "--output", help="保存网站截图 URL 的文件名")
args = parser.parse_args()
# 调用 wayback_machine 函数
wayback_machine(args.url, args.output)
其中 <url>是要获取截图的网站名称,<output_file>是可选参数,用于指定保存截图 URL 的文件名。
有不同的方式可以加q讨论:99270043