爬虫----代码段总结

最新推荐文章于 2024-07-12 17:01:23 发布

sunmlight

最新推荐文章于 2024-07-12 17:01:23 发布

阅读量207

点赞数 1

分类专栏： Python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39926957/article/details/80350232

版权

Python 同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

图片下载

response=requests.get(url,headers=headers)
if response.status_code==200:
    with open('123.jpg','wb') as f:
        f.write(response.content)
    print('ok')

图片下载 —scrapy

pipelines.py:

from scrapy.pipelines.images import ImagesPipeline
from scrapy.utils.project import get_project_settings
import os
#保存图片
class ImagePipeline(ImagesPipeline):
    def get_media_requests(self, item, info):
        image_path = item["nick_image"]
        yield scrapy.Request(image_path)

    #重命名
    def item_completed(self, results, item, info):
    iamge_path = [x["path"] for ok, x in results if ok]
    old_image_name = self.IMAGES_STORE+"/"+iamge_path[0]
    new_image_name = self.IMAGES_STORE+"/"+item['nick_name']+".jpg"
    os.rename(old_image_name,new_image_name)
    item["image_path"] = new_image_name

    return item

在setting中创建image目录: IMAGES_STORE = ‘./Image’

scrapy爬虫parse()回调实现下一页

    if self.offset < int(position_numbers):
        self.offset += 10
    new_url = self.url + str(self.offset) + "#a"
    yield scrapy.Request(new_url,callback=self.parse)

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫----代码段总结

图片下载response=requests.get(url,headers=headers)if response.status_code==200: with open('123.jpg','wb') as f: f.write(response.content) print('ok')图片下载 —scrapypipelines.py:...
复制链接

扫一扫

专栏目录

sunmlight CSDN认证博客专家 CSDN认证企业博客

码龄7年

27: 原创

33万+: 周排名

177万+: 总排名

4万+: 访问

: 等级

748: 积分

10: 粉丝

29: 获赞

16: 评论

22: 收藏

私信

关注

热门文章

分类专栏

Python 11篇
Django 8篇
爬虫 5篇
后端 8篇
数据库
Ubuntu 3篇
Play 4篇
前端 1篇

最新评论

Bootstrap文件上传美化 input()
郭等等等: 我需要导入什么jar包呢
Ubuntu美化之---Docky
_Liz: [code=plain] mkdir -p ~/Downloads/docky cd ~/Downloads/docky wget http://archive.ubuntu.com/ubuntu/pool/universe/g/gnome-sharp2/libgconf2.0-cil_2.24.2-4_all.deb wget http://archive.ubuntu.com/ubuntu/pool/main/g/glibc/multiarch-support_2.27-3ubuntu1_amd64.deb wget http://archive.ubuntu.com/ubuntu/pool/universe/libg/libgnome-keyring/libgnome-keyring-common_3.12.0-1build1_all.deb wget http://archive.ubuntu.com/ubuntu/pool/universe/libg/libgnome-keyring/libgnome-keyring0_3.12.0-1build1_amd64.deb wget http://archive.ubuntu.com/ubuntu/pool/universe/g/gnome-keyring-sharp/libgnome-keyring1.0-cil_1.0.0-5_amd64.deb sudo apt-get install ./*.deb wget http://archive.ubuntu.com/ubuntu/pool/universe/d/docky/docky_2.2.1.1-1_all.deb sudo apt-get install ./docky_2.2.1.1-1_all.deb [/code]
csv文件转字典()
OBLPlife: 这个f是什么东西
Ubuntu美化之---Docky
Major_renqi: 20.04无法安装了
Bootstrap文件上传美化 input()
sunmlight 回复银·白: 需要引入bootstrap和Jquery

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。