目录
目标:爬取 福利吧论坛 里的 福利汇总 文,将所有 福利汇总 文里的热门视频标题、链接以json格式保存,所有 福利汇总 文里面的图片按目录(目录名为当前图片所在页url中的7位数字),如某篇福利文 url 为http://fulibus.net/2019015.html,则该页内图片保存在当前项目目录下的 2019015 目录内
items.py
# -*- coding: utf-8 -*-
import scrapy
class ArticleItem(scrapy.Item):
title = scrapy.Field()
publish_time = scrapy.Field()
videos = scrapy.Field()
flhz.py
# -*- cod