如何用爬虫爬去一张图片

26 篇文章 0 订阅
6 篇文章 0 订阅

这次是一只简单的爬虫, 代码只有五行, 目的是爬去一张网页上的图片

先展示代码吧

import urllib.request

r = urllib.request.urlopen('http://image.samanlehua.com/mh/25933.jpg')
r = r.read()
with open('picture.jpg', 'wb') as f:
    f.write(r)
第一行: 导入urllib.request模块
urllib意思是url library. 是一个它提供了一系列操作url的功能, 是一个常用的也比较基础的基本库.

request模块的文档介绍是这样的: for opening and reading URLs. 所以, 我们要打开并读取一个url的内容就可以用url.request, 因为我们只需要用urllib的这一个模块, 所以只导入这个模块就好了.

第二行: 调用urlopen方法获取url内容
第三行: 调用read()方法
因为我们找到的这个url是图片文件, 它是二进制文件, 所以不用进行转码. 也就是说不用调用decode方法.
第四, 五行: 文件操作, 将图片保存
这两行代码就是python的文件操作了, 打开一个 picture.jpg文件, 并且以 wb的形式写入我们从url上读取的内容.

OK, 现在我们可以看到文件夹中出现了一个文件picture.jpg了, 也就是我们url链接的图片.

需要注意的是: 这个图片url链接是预先要知道的(自己到网页源代码里找). 所以说这个程序是非常鸡肋的, 但对初学爬虫者来说也算是个项目了.

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值