1.items 中声明两个字段 1)file_urls 2)files
2.spider 中定义parse方法。将所有的需要爬取的url通过response.urljoin方法改为绝对地址,再将url以列表形式放入items['file_urls']中。
3.settings 定义 FILE_STORE 文件存储路径。定义item_pipelines 需包含:scrapy.pipelines.file.FilesPipeline
4.运行即可
1.items 中声明两个字段 1)file_urls 2)files
2.spider 中定义parse方法。将所有的需要爬取的url通过response.urljoin方法改为绝对地址,再将url以列表形式放入items['file_urls']中。
3.settings 定义 FILE_STORE 文件存储路径。定义item_pipelines 需包含:scrapy.pipelines.file.FilesPipeline
4.运行即可