python用for循环读取图片_python 使用for循环简单爬取图片(1)

本文介绍了如何使用Python的urllib和re库爬取网页中的图片,通过分析URL规律实现对多张图片的爬取。在爬取过程中,通过for循环遍历不同页面,并详细讲解了在处理图片命名和多图集爬取时需要注意的点,包括图片命名冲突的解决。最后,展示了如何获取下一个图集的URL,为连续图集的爬取打下基础。
摘要由CSDN通过智能技术生成

现在的网站大多做了反爬处理,找一个能爬的网站还真不容易。

下面开始一步步实现:

1.简单爬录目图片

1 importurllib.request2 importre3

4 defgethtml(url):5 page=urllib.request.urlopen(url)6 html=page.read().decode('utf-8')7

8 returnhtml9

10 defgetimg(html):11

12 a=re.compile(r'src="(.+?.jpg)"')13 tp=a.findall(html)14 x=015

16 for img intp:17 urllib.request.urlretrieve(img,'d:/tupian/%s.jpg' %x)18 x+=1

19

20

21 url="http://www.meituba.com/yijing/28426.html"

22

23 html=gethtml(url)24 getimg(html)

2.爬图集

这里仅仅是爬取了录目上的图片,还没有涉及到for循环遍历,针对我们的目标,我们要尽可能仔细观察它的规律。

这里我们随便点进去一个图片集,如图:

58929a51abeac16e4405c7d24853dca2.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值