![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
简单技术
haozi233333
成为大牛吧!猪猪
展开
-
Python爬虫:爬取北京师范大学珠海分校课程表
本篇文章只是记录一下python课的小作业而已没啥技术含量。(顺便练练Markdown语法?)实现过程:需要的库:requests:请求网站bs4:用于解析HTML文件PIL:图像处理标准库,看验证码csv:把提取出的文件做成csv格式lxml:依旧是一个很好用的解析库io1.模拟登陆:打开教务网站,再打开开发者工具,有一个network选项,登陆后能看你的登录操作提交了哪些东...原创 2019-03-30 22:28:00 · 769 阅读 · 1 评论 -
【selenium】一次爬虫实战
前言由于我准备出去留学,所以我对一些租房的广告很感兴趣,所以萌生了爬取这个租房网站的想法。网站介绍与分析http://www.yeeyi.com/ :貌似是全球最大的,澳洲华人网站,上面有很多的租房信息。上图列表页的解析是比较简单的,bs4+lxml搞定(先抓取所有class=“ptxt” 的div,再慢慢提取列表的文字和网站)上图的详情页也是比较容易解析,先将id=“mytab...原创 2019-08-07 23:33:57 · 305 阅读 · 0 评论