python 图片爬虫记录

waterHBO

于 2024-08-04 17:20:54 发布

阅读量217

点赞数 3

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/waterHBO/article/details/140908347

版权

看了2-3个小时的奥运会，感觉内心空虚。写点代码。不知道做什么，随便搞一下爬虫，积累一点经验，写篇博客，记录一下。

1. 注意检查响应头

情况描述:

对于这样一个  图片的 url 

https://blogger.googleusercontent.com/img/a/AVvXsEjZ5whhS_q0FYJHMI1Zmubr8JVb6EaTSH37a5iKs-mY-NHuchpesWGTLJSI8u138t-l_iqy5q66Yw2k0Dlb9hmIxQh7EEwOquiU8LnhS5zwKv28bXtQHF6kR8r5xSFVpDOQNquTpxqq2f9nI-JkCEVRTczD6TRqUnOeZMew3gOdTIcI3ViR6k5EGjbw 

url 的结尾没有任何  .jpg

但是我当我 按下 ctrl + S 保存图片的时候， 浏览器会自动识别出图片的名字是：
006AfEgvgy1gv4vigvqbqj61x32z64qq02.jpg

浏览器是如何识别出来的呢

问了一下chatpgt ，答案是: Content-Disposition 的响应头
完整的聊天记录是

其实这个问题，我首先问的是 kimi ai, 结果回答得很垃圾。
然后我检查了自己的响应头, 果然发现了这个文件名，就是下图中的 filename

在这里插入图片描述

2. 第二个经验，就是多琢磨。有时候即便是"瞎碰", 也需要多“碰”几次。

情况描述:

在这里插入图片描述
我在检查 img 标签的时候，发现它提到的原始的尺寸是 4032 * 2525, 但是打开的图片，就是找不到原始的尺寸。

kimi 说删掉 url 中的 s1600，我试了，不对。
我把 s1600/ 以及后面的全删掉，还是不对。
其他尝试，也不对。

最终的办法是；把 s1600 换成 s0, 就获取到原始的图片尺寸了。

解决办法的来源

来源就是，多观察，多尝试。此页面提供了几百篇内容，我看看最老的，又看看最新的，发现它的内容，以及格式其实是有变化的。前期都是 s0, 估计是后期 api 改版了，增加了 s1600, 为了降低服务器的压力。

3. 放一下图片。

在这里插入图片描述

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
python 图片爬虫记录

看了2-3个小时的奥运会，感觉内心空虚。写点代码。不知道做什么，随便搞一下爬虫，积累一点经验，写篇博客，记录一下。
复制链接

扫一扫

waterHBO CSDN认证博客专家 CSDN认证企业博客

码龄8年

44: 原创

1万+: 周排名

3万+: 总排名

1万+: 访问

: 等级

779: 积分

254: 粉丝

324: 获赞

4: 评论

64: 收藏

私信

关注

热门文章

最新评论

python爬取某财富网
人道逍遥: 能完善下就好了
python爬取某财富网
熊哈哈O_o: 爬了个啥？
pytorch 基础笔记
CSDN-Ada助手: 很高兴看到你写了第二篇博客！继续创作下去吧，你的努力和分享对于学习者们来说都是非常有价值的。在你的博文中，你分享了一些基础的Tensor操作，这对于初学者来说是很有帮助的。除了你提到的Tensor操作，还有一些与PyTorch相关的扩展知识和技能可以进一步探索。例如，你可以学习如何使用PyTorch构建和训练神经网络模型，了解不同的损失函数和优化器，以及如何处理图像和文本数据等。此外，你还可以学习如何使用PyTorch进行分布式训练和模型部署，这对于处理大规模数据和实际应用非常重要。希望以上建议对你有所帮助，继续保持谦虚的学习态度，你会在PyTorch的学习和实践中不断成长的！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。