网络爬虫使用playwright工具来替代selenium工具,模拟浏览器加载动态网页,应对使用了json、ajax的复杂网站,从而通过网络爬虫实现网站自动登录并签到,设计思想如下:
1、打开网站登录页面,输入登录账号进行登录;
2、保存已登录cookies信息用于下次自动登录;
3、使用已获取的cookies来免登陆,打开签到页面,点击签到按钮,实现签到。
import time
import json
# 使用playwright同步API
from playwright.sync_api import sync_playwright
# 实现XX网站自动签到
# 自动登录,保存Cookies到文件。
def saveCookies():
with sync_playwright() as p:
# 显示浏览器,每步操作等待50毫秒
browser = p.firefox.launch(headless=False, slow_mo=50)
context = browser.new_context()
page = context.new_page()
#读取登录账户信息
userf = open('login_account.txt', 'r').readlines()
#对账号进行枚举
for count