- 博客(2)
- 收藏
- 关注
原创 Requests+re爬虫框架爬取教务系统课程信息
爬取教务系统课程数据requests+re爬虫和解析框架,注意是这个教务系统类型效果图如下#### 直接上源码,注意自己看懂修改意义更大,同时用户名和密码我遮盖掉了下面展示源码(全原创)其中正则表达式部分有小错误,如果比较苛刻的同学可以自己再寻找规律修改。// A code blockvar foo = 'bar';// An highlighted block# coding:u...
2020-04-02 02:13:02 1375 2
原创 爬虫篇_淘宝模拟登陆和搜索_selenium库的使用
综述本博客参考多人博客综合的方法,写于2019.12.19,随后可能会由于网站结构的变化和反爬机制而导致代码思路需要修改和优化。淘宝的网站(https://www.taobao.com/)经历了多年的变化,如今越来越难以爬取。采用selenium库模拟登陆的朋友们会发现,无论如何都通过不了滑块验证(淘宝登陆界面能识别selenium库的自动化登陆),因此本文采用的是选择微博登陆而绕过该反爬机制...
2019-12-19 11:15:23 1100 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人