在爬取一系列页面时,发现数据总是少的34条,刚开始还以为爬错了,测试了半天发现,yield 语句的执行次数没问题,就是回调函数次数总少,经过一番对yield 的查找,终于找到是参数设置的问题,一下是解决方法:
添加参数设置为不过滤
dont_filter=True
至于为什么要过滤,还需要在研究研究
在爬取一系列页面时,发现数据总是少的34条,刚开始还以为爬错了,测试了半天发现,yield 语句的执行次数没问题,就是回调函数次数总少,经过一番对yield 的查找,终于找到是参数设置的问题,一下是解决方法:
添加参数设置为不过滤
dont_filter=True
至于为什么要过滤,还需要在研究研究