利用python抓取网络图片的步骤:
1.根据给定的网址获取网页源代码
2.利用正则表达式把源代码中的图片地址过滤出来
3.根据过滤出来的图片地址下载网络图片
import re
import urllib
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImg(html):
reg = r'src="(.+?\.jpg)" pic_ext'
imgre = re.compile(reg)
imglist = imgre.findall(html)
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' % x)
x = x + 1
html = getHtml("http://tieba.baidu.com/p/2460150866")
getImg(html)
本文介绍了一种使用Python进行网络图片抓取的方法。主要步骤包括:通过URL获取网页源代码;运用正则表达式从源代码中提取图片链接;最后下载这些图片到本地。该教程提供了一个简单的示例,展示了如何从百度贴吧页面抓取图片。

778

被折叠的 条评论
为什么被折叠?



