爬虫Task1
目标
爬虫小白,希望熟悉爬虫的流程,学会基础的爬虫代码
任务
1.1 学习get与post请求
- 学习get与post请求,尝试使用requests或者是urllib用get方法向https://www.baidu.com/发出一个请求,并将其返回结果输出。
- 如果是断开了网络,再发出申请,结果又是什么。了解申请返回的状态码。
- 了解什么是请求头,如何添加请求头。
1.2 正则表达式
- 学习什么是正则表达式并尝试一些正则表达式并进行匹配。
- 然后结合requests、re两者的内容爬取https://movie.douban.com/top250里的内容
- 要求抓取名次、影片名称、年份、导演等字段。
结果
小白,完全不知怎么入手,照着参考资料跑了下程序,结果还不对。本想快速的入手,结果还是自己学,时间还是费了不少,看来实现目标艰难!!