- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 python自动识别验证码 模拟登陆古诗文网
#接下来发表的是自动识别验证码模拟登陆的方式 --共勉1.验证码识别,获取验证码数据2.对post请求发送处理参数import osimport requestsfrom lxml import htmlimport chaojiying as cjyif name == ‘main’:# 使用session 自动获取到cookie信息session = requests.Session()url = ‘https://so.gushiwen.cn/user/collect.aspx’
2021-05-22 18:03:24
432
原创 python使用xpath爬取模板
import requestsfrom lxml import htmlimport os防止爬取中断报错verify=False要实现循环获取创建目录if not os.path.exists("/Users/apple/Desktop/job模版"):os.mkdir("/Users/apple/Desktop/job模版")设置文件保存的基本目录os.chdir("/Users/apple/Desktop/job模版")if name == ‘main’:# url地址url
2021-05-21 23:12:42
203
原创 使用python爬取三国演义
此篇使用的是python进行数据爬虫爬取工具使用的是:bs4,requests爬取的网站:https://www.shicimingju.com/book/sanguoyanyi.html爬取的内容:三国演义– coding:utf-8 –from bs4 import BeautifulSoup as bsimport requestsimport os爬取三国演义章节标题及其对应的内容os.chdir(’./爬取的文件’)if name == ‘main’:url = 'https
2021-05-15 18:21:59
2436
2
windows-x64_FineBI5_1-CN.exe
2020-09-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人