![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫基础
weixin_44150147
这个作者很懒,什么都没留下…
展开
-
爬虫任务一
【任务一】1.1 学习get与post请求学习get与post请求,尝试使用requests或者是urllib用get方法向https://www.baidu.com/发出一个请求,并将其返回结果输出。如果是断开了网络,再发出申请,结果又是什么。了解申请返回的状态码。了解什么是请求头,如何添加请求头。在客户机和服务器之间进行请求-响应时,两种最常被用到的方法是:GET 和 POST。G...原创 2019-04-07 18:37:57 · 870 阅读 · 0 评论 -
爬虫三
Task33.1 Task5 安装selenium并学习安装selenium并学习。使用selenium模拟登陆163邮箱。163邮箱直通点:https://mail.163.com/ 。参考资料:https://blog.csdn.net/weixin_42937385/article/details/881503793.2 Task6 学习IP相关知识学习什么是IP,为什么会出...原创 2019-04-11 21:30:19 · 143 阅读 · 0 评论 -
爬虫-beautifulsoup&xpath
Task22.1 学习beautifulsoup学习beautifulsoup,并使用beautifulsoup提取内容。Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.参考文档:https://www.crummy.c...原创 2019-04-09 21:24:41 · 174 阅读 · 0 评论 -
爬虫4
Task44.1 Task7 实战大项目实战大项目:模拟登录丁香园,并抓取论坛页面所有的人员基本信息与回复帖子内容。丁香园论坛:http://www.dxy.cn/bbs/thread/626626#626626# 实战大项目:模拟登录丁香园,并抓取论坛页面所有的人员基本信息与回复帖子内容。from selenium import webdriverimport timefrom...原创 2019-04-13 21:21:47 · 135 阅读 · 0 评论