用python爬取斗图啦图片

一、代码部分

# -*- coding:utf-8 -*-

'''
1python版本 python3.6
2IDE PyCharm 2017.3
'''
import requests
import urllib.request
import re

#获取每一个主页面中的分类条目url链接
def get_page(num):
    html = requests.get("http://www.doutula.com/article/list/?page=)"+str(num)).text
    reg = '<a href="(.*?)" class="list-group-item'
    urls = re.findall(reg, html)
    return urls

#获取分类条目中每个图片的url链接
def get_pic(urls):
    html = requests.get(urls).text
    reg = '<img src="(.*?)" alt'
    urls = re.findall(reg, html, re.S)
    return urls

#下载图片
n=1
for x in range(2):
    print("正在下载第{}......".format(x+1))
    for i in get_page(x):
        for j in get_pic(i):
            pic_file = "D:/0PyCharmProject/pic/"+str(n)+".jpg"
            urllib.request.urlretrieve(j, pic_file)
            n = n + 1
print("下载完成,共下载{}张图片".format(n-1))

二、运行结果


三、下载图片


  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值