在settings中原本是一个USER_AGENT,现在增加USER_AGENT_LIST列表,目的是每次爬虫一个网址的时候,不用总用同一个User-Agent
书写中间件:
settings中开通中间件:
此时已经完成了 每次爬取网址的时候使用不同的User-Agent的处理。
如果要查看每次用了哪些User-Agent?
可以在def parse中打印response的值即可。
展示:
在settings中原本是一个USER_AGENT,现在增加USER_AGENT_LIST列表,目的是每次爬虫一个网址的时候,不用总用同一个User-Agent
书写中间件:
settings中开通中间件:
此时已经完成了 每次爬取网址的时候使用不同的User-Agent的处理。
如果要查看每次用了哪些User-Agent?
可以在def parse中打印response的值即可。
展示: