python抓取百度贴吧高清图片

#coding:utf8
import urllib
import re

def getHtml(url):
    s = urllib.urlopen(url)
    content = s.read()
    return content

def getImg(html):
    pat = r'http://imgsrc.baidu.com/.*sign=.*\.jpg'
    #rem = re.compile(pat,re.I)
    #t = r'http://imgsrc.baidu.com/forum/w%3D580/sign=b2d2b3bb632762d0803ea4b790ed0849/a317fdfaaf51f3deafb1b5fc94eef01f3a297923.jpg'
    result = re.findall(pat,html)
    print result[0]
    print result[1]
    #saveImg(result[0])
    count = 1
    for i in result:
        saveImg(i,count)
        count += 1

def saveImg(imgUrl,count):
    basePath = r'D://python/img/'
    pat = r'^http://.*/([^/]*\.jpg)$'
    name = re.findall(pat,imgUrl)
    path = basePath + name[0]
    print path
    imgContent = urllib.urlopen(imgUrl).read()
    imgFile = open(path,'w')
    imgFile.write(imgContent)
    imgFile.close()
    print '保存第%s张图片成功' %(count)

str = r'http://tieba.baidu.com/p/1782042697?see_lz=1'

html = getHtml(str)
print '#' * 20
getImg(html)


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值