Python爬取网页简单数据---以及详细解释用法!入门从这开始!

本文介绍了如何使用Python进行简单的网页爬取,以拉勾网的Python职位薪资数据为例,讲解了如何获取请求头、解析HTML标签以及避免频繁请求服务器的注意事项。同时,鼓励读者尝试将数据保存到本地文件中。
摘要由CSDN通过智能技术生成

一、准备工作(找到所需网站,获取请求头,并用到请求头)

  • 找到所需爬取的网站 (这里举拉勾网的一些 静态数据 的获取)-----------
  •  
  • 请求头的作用 :模拟真实用户进入网站浏览数据-----------headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.90 Safari/537.36',}
  • r=requests.get("https://www.lagou.com/zhaopin/Python/",headers=headers)-------------------这两行就是模拟用户进入网站
  • 找到数据所在网页的标签 (html网页右键源代码查看即可)

假设 这里的15k-25k是我们要的数据,右键查看 按箭头查看即可-----例如这里是span标签class=''money''( 可以点击下面的控制台查看money是什么属性,有的是id=“money”这样的 )------具体得看html代码

 

私信博主001  领取完整代码!

 

  • 准备工作完毕
<
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值