一、准备工作(找到所需网站,获取请求头,并用到请求头)
- 找到所需爬取的网站 (这里举拉勾网的一些 静态数据 的获取)-----------
- 请求头的作用 :模拟真实用户进入网站浏览数据-----------headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.90 Safari/537.36',}
- r=requests.get("https://www.lagou.com/zhaopin/Python/",headers=headers)-------------------这两行就是模拟用户进入网站
- 找到数据所在网页的标签 (html网页右键源代码查看即可)
假设 这里的15k-25k是我们要的数据,右键查看 按箭头查看即可-----例如这里是span标签class=''money''( 可以点击下面的控制台查看money是什么属性,有的是id=“money”这样的 )------具体得看html代码
私信博主001 领取完整代码!
- 准备工作完毕