python爬取花瓣网图片

本文介绍了使用Python3.5进行网页抓取的实践,具体目标是下载花瓣网上美女图片。通过获取图片URL并利用urllib.request.urlretrieve()方法,将图片保存至本地。代码中包含详细注释,运行脚本后,目标图片会被保存到脚本所在的目录。
摘要由CSDN通过智能技术生成

环境:python3.5

今天拿抓取花瓣网上的美女图片来练练手

抓取图片,主要是要知道图片资源的url,知道了url后,就可以使用urllib.request.urlretrieve( )方法保存到本地了。

下面就直接贴代码吧,代码中有详细注释。

#coding:utf-8
'''
Created on 2016年8月16

@author: FangLiang
'''

import urllib.request
import re

#### 获取网页源码
def getHtml(url):
    page = urllib.request.urlopen(url)
    html = page.read().decode('utf-8')     #需要解码
    return html

#### 下载图片
def getImage(html):
    #### 获取HTML源码里面的app.page["pins"]部分,主要图片ID位于此部分
    app_page_pins_re = re.compile(r'app.page\\["pins"\\](.*?);',re.S)
    app_page_pins_str = re.findall(app_page_pins_re,html)[0]
    
    pin_id = r'"pin_id":(\d+)'
    pin_id_re = re.compile(pin_id)
    #### 获取图片ID,保存在列表中
    pin_id_list = re.findall(pin_id_re,app_page_pins_str)
    x = 0
    for pinid in
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值