第一个Python3.0 爬虫程序, 爬取百度贴吧图片

 

第一个Python3.0 爬虫程序, 爬取百度贴吧图片

 

基于python 3.0 

 

#print("hello222")
# coding= utf-8
import urllib.request
import  re

def getHtml(url):
    page = urllib.request.urlopen(url)
    html = page.read()
    return html

a = input('inpt url:')
html = getHtml(a)


def getImg(html):
    reg = r'src="(.+?\.jpg)"'
    #reg = r'img.src="(.*?)"'
    imgre = re.compile(reg)
    html = html.decode('utf-8')
    imglist = re.findall(imgre, html)
    local = 'd://google'
    '''
    '''
    x = 0
    print(len(imglist))
    for imgurl in imglist:
        urllib.request.urlretrieve(imgurl, local + '%s.jpg' % x)
        x += 1
    #return imglist

#html = getHtml("http://tieba.baidu.com/p/2460150866")
getImg(html)
#print(img)
#print(html)

 

 

看运行:

 

看结果: 我这个是直接下载到我的D盘

 

由于转码的问题,还有点不足,基本上可以实现爬虫下载文件

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangxiaoming

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值