向后台请求img的url出现403的解决办法

最近在使用爬虫爬取数据的时候,发现很多网站为了保护版权都加入了防盗链。具体表现为:在本地访问图片正常,url访问也可以,但是img的src访出现403。在网上查阅了一些资料后发现了解决问题的办法。可以在img标签中加上

referrer="no-referrer"


也可以在html的header头部加入

<meta name="referrer" content="no-referrer" />


出现403的状态其实是因为http请求的header中有一个referrer用来标识当前请求来自那个网站,这个值是可以省略但是不能修改的。这样服务器可以通过这个值判断是不是本站访问,如果不是就做相应处理。

这里有一篇关于referrer的文章。有些东西我们只用知道错误的原因,然后找到对应的解决办法即可,技术这个东西想面面俱到很难。

PS:爬取第三方网站的资源,一定要标识转载来源。
————————————————
版权声明:本文为CSDN博主「san生石」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/nookl/article/details/94217402

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
用户通过浏览器输入URL访问上传到本地管理后台的图片的具体步骤如下: 1. 用户在浏览器的地址栏中输入URL,例如 `http://example.com/admin`,并按下回车键。 2. 浏览器解析URL,提取出域名(例如 `example.com`)和路径(例如 `/admin`)。 3. 浏览器通过DNS解析将域名 `example.com` 转换为对应的IP地址。 4. 浏览器根据IP地址建立与目标服务器的TCP连接。 5. 浏览器向服务器发送HTTP请求请求的目标是域名 `example.com` 的主机的 `/admin` 路径。 6. 服务器接收到请求后,根据路径 `/admin` 进行相应的处理。这可能涉及到身份验证、权限验证等过程,以确保用户有权访问管理后台。 7. 如果用户通过身份验证和权限验证,服务器会返回一个包含管理后台页面的HTML响应。 8. 在管理后台页面中,如果存在已上传的图片,页面中会包含相应的图片元素(例如 `<img>` 标签),其中指定了图片的URL地址。 9. 浏览器解析HTML响应,并根据图片元素中指定的URL地址发送额外的HTTP请求获取图片资源。 10. 服务器接收到针对图片资源的HTTP请求后,会返回相应的图片文件。 11. 浏览器接收到图片文件后,将其解析并在管理后台页面中显示出来,供用户查看和操作。 总结来说,用户通过浏览器输入URL访问上传到本地管理后台的图片,涉及到建立TCP连接、发送HTTP请求、服务器处理请求、返回HTML响应、解析HTML响应、发送额外的请求获取图片资源等多个步骤。这些步骤共同完成了用户在浏览器中浏览并获取本地管理后台中已上传的图片的过程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值