爬网页的时候设置了头但是还是不能爬取的原因

!!!
肯定是你的头设置错了
最开始爬百度的时候 我的代码是这样写的:

import requests
url = "https://www.baidu.com/"
head = {
  "user_Agent": "Mozilla/5.0"}
data = requests.get(url , headers = head)

这样写完全没问题,能正确爬取页面
但事实在爬取猫眼的时候就不可以了,
显示的是403,错误代码
其实原因很简单出在头的位置,
我们爬虫实际上是模拟人的操作的
故只要让他认为你是浏览器就可以了
故原因肯定是在头上


                
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值