爬虫学习总结

爬虫学习总结:

  1. 爬虫第一步:确定需求,今天爬虫的目的是什么。-
  2. 爬虫第二步:导入爬虫所需的库
    import requests
    import re
    import time
  3. 爬虫第三步:确认爬取所需的url 和请求头
    url=‘http://www.爬取的网址/’
    headers=={‘User-Agent’:’ 自己的user-agent '}
  4. 爬虫第四步:requests 去获得网页数据
    res=requests.get(headers=headers,url=url)
  5. 爬虫第五步:解析网页数据,得到自己想要的部分。
  6. 爬虫第六步:将获得的数据存储
  7. 一点想法:
    看了好多人的爬虫视频,也看了相关书籍,感觉自己目前最大的问题就是数据的解析部分,总是会出问题,也没想着爬取多难的数据,只是觉得,能够以下子从网页上爬取到很多东西,比如图片,一下子全部存储下来,真的很酷,希望在复习中学习。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值