爬取福利吧论坛所有的福利汇总文(视频标题链接、图片)

最新推荐文章于 2024-04-19 11:04:29 发布

Granthoo

最新推荐文章于 2024-04-19 11:04:29 发布

阅读量8.4w

点赞数

分类专栏： python 爬虫文章标签：图片目录爬虫福利汇总

本文链接：https://blog.csdn.net/Granthoo/article/details/86708392

版权

items.py

flhz.py

pipelines.py

目标：爬取福利吧论坛里的福利汇总文，将所有福利汇总文里的热门视频标题、链接以json格式保存，所有福利汇总文里面的图片按目录（目录名为当前图片所在页url中的7位数字），如某篇福利文 url 为http://fulibus.net/2019015.html，则该页内图片保存在当前项目目录下的 2019015 目录内

items.py

# -*- coding: utf-8 -*-
import scrapy


class ArticleItem(scrapy.Item):
    title = scrapy.Field()
    publish_time = scrapy.Field()
    videos = scrapy.Field()

flhz.py

# -*- cod

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Granthoo

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
爬取福利吧论坛所有的福利汇总文(视频标题链接、图片)

目录items.pyflhz.py pipelines.py 目标：爬取福利吧论坛里的福利汇总文，将所有福利汇总文里的热门视频标题、链接以json格式保存，所有福利汇总文里面的图片按目录（目录名为当前图片所在页url中的7位数字），如某篇福利文 url 为http://fulibus.net/2019015.html，则该页内图片保存在当前项目目录下的 20...
复制链接

扫一扫