data = self._sock.recv(self._rbufsize)
error: [Errno 10054]
编写爬虫时,运行代码出现了如下的错误,
对一个网站使用大量的urlopen()操作,会被那个网站认为攻击行为,网站会把你封了,就有不允许下载的情况,导致urlopen()后,request.read()一直卡死在那,不能继续下去,最后会抛出这个异常。
即使添加了useragent,也会出现同样的问题。
解决方法:可以添加一些延时。隔一段时间访问一次。
data = self._sock.recv(self._rbufsize)
error: [Errno 10054]
编写爬虫时,运行代码出现了如下的错误,
对一个网站使用大量的urlopen()操作,会被那个网站认为攻击行为,网站会把你封了,就有不允许下载的情况,导致urlopen()后,request.read()一直卡死在那,不能继续下去,最后会抛出这个异常。
即使添加了useragent,也会出现同样的问题。
解决方法:可以添加一些延时。隔一段时间访问一次。