何为标准-CSDN博客

原创 python自动识别验证码模拟登陆古诗文网

#接下来发表的是自动识别验证码模拟登陆的方式 --共勉1.验证码识别，获取验证码数据2.对post请求发送处理参数import osimport requestsfrom lxml import htmlimport chaojiying as cjyif name == ‘main’:# 使用session 自动获取到cookie信息session = requests.Session()url = ‘https://so.gushiwen.cn/user/collect.aspx’

2021-05-22 18:03:24 432

原创 python使用xpath爬取模板

import requestsfrom lxml import htmlimport os防止爬取中断报错verify=False要实现循环获取创建目录if not os.path.exists("/Users/apple/Desktop/job模版"):os.mkdir("/Users/apple/Desktop/job模版")设置文件保存的基本目录os.chdir("/Users/apple/Desktop/job模版")if name == ‘main’:# url地址url

2021-05-21 23:12:42 203

原创使用python爬取三国演义

此篇使用的是python进行数据爬虫爬取工具使用的是：bs4，requests爬取的网站：https://www.shicimingju.com/book/sanguoyanyi.html爬取的内容:三国演义– coding:utf-8 –from bs4 import BeautifulSoup as bsimport requestsimport os爬取三国演义章节标题及其对应的内容os.chdir(’./爬取的文件’)if name == ‘main’:url = 'https

2021-05-15 18:21:59 2436 2