简单几行Python代码,爬取网站图片

Python的语法很简单容易上手,适合拿来做爬虫,我做了一个简单地爬取下载网站图片
一、找到你想要爬取图片的链接地址
二、当然是编写我们的Python代码
Python版本是 3.6.2

#codeing = utf-8
#官方3.0版本已经把urllib2,urlparse等五个模块都并入了urllib中
import urllib.request
import re

def getHtml(url):
    #打开连接
    page = urllib.request.urlopen(url)
    #获取网页内容
    html = page.read()
    print(html)
    return html

def getImg(html):
    #正则表达式
    reg = r'src="(.+?\.jpg)" alt='
    imgre = re.compile(reg)
    #以列表的形式返回能匹配的子串
    imgList = re.findall(imgre,html.decode('utf-8'))
    x=0
    for imgurl in imgList:
        #把爬取到的资源保存到本地
        urllib.request.urlretrieve(imgurl,'%s.jpg' % x)
        x+=1
    return imgList
#输入你想要爬取的网站
html=getHtml("http://pic.yxdown.com/list/0_0_1.html")
print(getImg(html))

三、运行代码,就可以爬取好需要的图片了
这里写图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值