现在很多网站的api接口返回httpcode返回码是403提示禁止访问。如果您也遇到这样的情况,请先不要急着去修改网站相关的参数
第一、先进api的网站。用浏览器访问,如果浏览器访问该api接口能成功。说明是设置了权限的问题。如果不能成功的话。很可以是该接口已修改或已失效,这时候就没办法访问了。
第二、如果浏览器能访问成功的话。那就好办了。调用该接口时,捕获异常中的responseBody,很有可能数据就在这里面,笔者就遇到的是这种问题。
直接上代码:
try { //这里调用api接口 } catch (WebException ex) { var strm = ex.Response.GetResponseStream(); strm.Position = 0;

当爬虫遇到403禁止访问错误时,可尝试通过浏览器访问API接口来排查问题。如果浏览器能成功访问,可能是权限设置导致,可检查返回的responseBody寻找解决方案。代码示例来源于博客。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



