爬虫学习

目标

爬虫小白,希望熟悉爬虫的流程,学会基础的爬虫代码

任务

1.1 学习get与post请求

  1. 学习get与post请求,尝试使用requests或者是urllib用get方法向https://www.baidu.com/发出一个请求,并将其返回结果输出。
  2. 如果是断开了网络,再发出申请,结果又是什么。了解申请返回的状态码。
  3. 了解什么是请求头,如何添加请求头。

1.2 正则表达式

  1. 学习什么是正则表达式并尝试一些正则表达式并进行匹配。
  2. 然后结合requests、re两者的内容爬取https://movie.douban.com/top250里的内容
  3. 要求抓取名次、影片名称、年份、导演等字段。

结果

小白,完全不知怎么入手,照着参考资料跑了下程序,结果还不对。本想快速的入手,结果还是自己学,时间还是费了不少,看来实现目标艰难!!
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值