Python的语法很简单容易上手,适合拿来做爬虫,我做了一个简单地爬取下载网站图片
一、找到你想要爬取图片的链接地址
二、当然是编写我们的Python代码
Python版本是 3.6.2
#codeing = utf-8
#官方3.0版本已经把urllib2,urlparse等五个模块都并入了urllib中
import urllib.request
import re
def getHtml(url):
#打开连接
page = urllib.request.urlopen(url)
#获取网页内容
html = page.read()
print(html)
return html
def getImg(html):
#正则表达式
reg = r'src="(.+?\.jpg)" alt='
imgre = re.compile(reg)
#以列表的形式返回能匹配的子串
imgList = re.findall(imgre,html.decode('utf-8'))
x=0
for imgurl in imgList:
#把爬取到的资源保存到本地
urllib.request.urlretrieve(imgurl,'%s.jpg' % x)
x+=1
return imgList
#输入你想要爬取的网站
html=getHtml("http://pic.yxdown.com/list/0_0_1.html")
print(getImg(html))
三、运行代码,就可以爬取好需要的图片了