scrapy爬虫下载文件、重命名文件

最新推荐文章于 2024-05-16 11:47:28 发布

ymd8005

最新推荐文章于 2024-05-16 11:47:28 发布

阅读量7.1k

点赞数 2

分类专栏： python爬虫文章标签： scrapy scrapy下载文件 scrapy重命名文件 python下载文件 python爬虫

本文链接：https://blog.csdn.net/YMD8005/article/details/79224377

版权

scrapy下载文件并重命名文件，python下载文件并重命名文件

目标：下载网页 http://www.zimuku.cn/search?q=&t=onlyst&p=1 上的字幕文件

设计：涉及scrapy的文件下载中间件

扩展：下载图片也是同样的原理

代码：如下

(1)爬虫模块

# coding:utf-8

import sys
import urllib
import os
reload(sys)
sys.setdefaultencoding( "utf-8" )

import scrapy
from w3lib.html import remove_tags
from subtitle_crawler.items import SubCrawlerItem

class SubSpider(scrapy.Spider):
    name = "sub"
    allowed_domains = []
    start_urls = [
            "http://www.zimuku.cn/search?q=&t=onlyst&p=%s" %i for i in range(1,21)
    ]

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ymd8005

关注关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
4
评论
scrapy爬虫下载文件、重命名文件

scrapy下载文件并重命名文件，python下载文件并重命名文件目标：下载网页 http://www.zimuku.cn/search?q=&amp;t=onlyst&amp;p=1 上的字幕文件设计：涉及scrapy的文件下载中间件扩展：下载图片也是同样的原理代码：如下(1)爬虫模块# coding:utf-8import sysimport urllibimport osreloa...
复制链接

扫一扫