爬取豆瓣电影的明星图片

忽然心血来潮,逛豆瓣电影的时候,发现明星相册里的图片还挺多的,于是就想着把相册里的所有照片爬下来

刚开始我就查看页面源码,发现照片的链接是以webp结尾,直接下载的文件格式依然是.webp,(查了一下,目前只有Google和opera在用webp,用别的浏览器看到的还是.jpg)发现直接将webp转成jpg,对于我这个菜狗来说有难度,于是想到改后缀名的方法

后来我发现可以直接在请求头设置接受你所需要格式的图片

headers = {
    "referer": "https://movie.douban.com/",
    "User-Agent":"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36",  # 自己使用的浏览器
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/jpg,*/*;q=0.8",
    "Accept-Encoding": "gzip, deflate, sdch"
}

如果需要webp格式,直接将"Accept"里的image参数改成webp

之后我们观察一下我们需要爬取照片所在的标签

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值