- 博客(3)
- 收藏
- 关注
原创 requests+bs4爬取网页内容——以爬取网页文章信息为例
一、引言目标网址:https://gary666.com/learn爬取方式:requests+bs4难度:易基本爬取的内容:输出:页面中所有的文章的标题、内容、作者、文章分类、时间 对应上图(标题为win10python安装配置selenium 、作者是Gary、文章分类python、时间2020-7-9)选做内容:数据存储:txt、excel、数据库(mysql、sqlite等)翻页:https://gary666.com/learn?page=2,url
2020-08-17 16:46:15 8895
原创 requests+bs4使用(post方式)
这里写自定义目录标题requests+bs4使用(post方式)一、介绍二、参考代码requests+bs4使用(post方式)参看文献:关于json格式的介绍:https://blog.csdn.net/woay2008/article/details/94366000使用chrom浏览器Network查看前后台数据传输请求:https://blog.csdn.net/museions/article/details/75144263不同浏览器前端调试查看返回页面的json数据:https:
2020-08-08 09:21:06 659
原创 使用post方式模拟登录作业管理系统
一、介绍1.登录的路由https://homewk.cn/login主要是模拟登录2.需要post的参数username(你的学号)password(你的学号对应的系统密码【采用了md5加密,后面会给加密函数】)identity_id(身份:固定为Student)3.输入用户的账号和密码4.输出怎么判断是否登录成功:可以查看特定内容是否加载出来,比如登录成功后会有你的姓名信息,登录失败则没有;或者通过特定的标签(或者特殊的属性),比如登录失败有id为msg的错误提示,登录成功
2020-08-08 09:19:42 1122 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人