前言
在进行数据爬取的时候,出现如下错误,一直显示response.status_code
为418
1. 原理
执行程序的时候一直返回418,最根本的原因是因为网站的反爬程序返回的结果
查询溯源,其解释权为
418 I’m a teapot
The HTTP 418 I’m a teapot client error response code indicates that the server
refuses to brew coffee because it is a teapot. This error is a reference to Hyper
Text Coffee Pot Control Protocol which was an April Fools’ joke in 1998
网址中添加了反爬程序识别,我们爬取数据的时候会返回418的结果。
我们使用的请求requests
由于没有添加请求头的一些信息,被反爬程序识别,而得到418结果
为了阻止这种结果,爬取成功,可以在请求头中加入一些信