自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 scrapy TCP connection time out 10086. 代理ip失效 请求超时 如何处理

在理的代理ip的中间件中 写一个方法 process_exception 当请求报错时 中间件会调用 process_exception 方法 你可以在这个方法里写你的自定义的处理方法 我这个方法是重新请求一次   class ProxyMiddleWare(object): def process_request(self, request, spider): proxy_...

2019-02-19 11:39:52 2062

原创 如何让 scrapy 不忽略 403的响应

在设置中加入 HTTPERROR_ALLOWED_CODES = [403] 这样 可以使403状态的响应不被自动忽略,可以自响应中对403 的响应做个性化处理

2019-02-19 11:02:26 725

转载 linux 环境下批量杀死进程

ps -ef | grep module- | grep -v module-mxm | cut -c 9-15 | xargs kill -9   ps -ef | grep module-   查找关键字包含module-的所有进程   grep -v module-mxm 排除module-mxm的进程   cut -c 9-15 截取第9至15字符(进程id)   x...

2018-07-27 16:43:45 165

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除