提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
此博客只能实现对登录成功界面的爬取,只能爬取到原生界面,网页还有大量ajax加载并未完全解决。
项目代码
#!/usr/bin/python
# -*- coding: UTF-8 -*-
"""
@author:${柒}
@file:古诗文网模拟登录.py
@time:2022/03/27
"""
import requests
from lxml import etree
from hashlib import md5 #这个库是超级鹰要用到的所以需要导入
from chaojiying import Chaojiying_Client
if __name__ == '__main__':
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36 Edg/99.0.1150.46'
}
#定义一个构造函数用于传参,用户名,密码,软件id可以固定为自己在平台申请的,传两个参数:验证码图片路径和验证码格式
def transform_image(img_path,img_type):
chaojiying = Chaojiying_Client(用户名,密码,软件id)
im = open(img_path, 'rb').read()
print("此刻验证码为:" +