python使用正则爬取图片

原创 2018年04月15日 17:37:31
# encoding:utf-8
import re # 使用正则 匹配想要的图片
import requests #使用requests得到网页源码
num = 1
# 定义mzt函数
def mzt():

          # 这个是用来编辑图片的名字 (因为不喜欢看他原来图片的名字感觉乱乱的)
        for i in range(1, 3):  # 循环100次 (可以用三元运算)
            # 得到图片的链接 并设置编码格式
            yuan = requests.get('http://www.mzitu.com/zipai/' + str(i)).content.decode('utf-8')
            demo = re.compile('<img src="(.*?)" .*?>', re.S)  # 找到图片正则
            list1 = demo.findall(yuan) # 去源码中找匹配到的这个链接
            write_os(list1)
def write_os(list1):
        global num
        for j in list1: # 遍历你得到的图片
            num += 1 # 循环一次加一
            yuan = requests.get(j).content # 得到你图片的内容
            # 写进本地
            with open('E:\\testtupian\\' + str(num) + '.jpg', 'wb') as f:
                f.write(yuan) # 写进去
                f.close() # 关闭文件


if __name__ == '__main__': # 代码测试片段
   mzt() # 调用你的函数

使用python操作Oracle

Python作为一门易学易用且不失强大的语言, 国内外不乏用Python开发的从桌面系统到复杂大型系统的例子。但作为脚本语言中的一位著名代表,Python不仅可以用来取代Java、C++等系统 语言来开发复杂的大型系统,也可以被当作一种辅助工具用来做一些日常工作中的琐碎的事情,比如备份、生成测试数据、日志分析等等。本文将通过一些简单的例 子来演示如何使用Python来访问Oracle进行基本操作。
  • 2016年07月09日 09:03

python3使用正则爬取妹子图

# encoding:utf-8 import re # 使用正则 匹配想要的图片 import requests #使用requests得到网页源码 这里就简单的做一个函数 # 定义mzt函数...
  • qq_39248703
  • qq_39248703
  • 2017-06-29 15:50:41
  • 797

python实例1--用正则表达式爬取静态网页上的图片

本来使用的是python3配合pycharm,但是编码问题一直有问题, 最开始时是: TypeError: cannot use a string pattern on a bytes-like ob...
  • kkevinyang
  • kkevinyang
  • 2016-02-12 12:18:05
  • 4416

Python 爬取163整个网站的图片 多线程 深度控制 相对路径处理 请求间隔控制 正则匹配

# coding:utf-8 import urllib import urllib2 import re import time import threading import socket imp...
  • chenyun19890626
  • chenyun19890626
  • 2017-02-08 11:39:32
  • 340

利用python正则表达式抓取网页中的图片到本地

正则表达式语法: * 匹配前一个字符0次或无限次 + 匹配前一个字符1次或无限次 ? 匹配前一个字符0次或1次 {m}/{m,n}匹配前一个字符m次或m到n次 *? / +? / ?? ...
  • stopcpp
  • stopcpp
  • 2017-04-07 15:59:10
  • 2591

[python爬虫] 正则表达式使用技巧及爬取个人博客实例

这篇博客是自己《数据挖掘与分析》课程讲到正则表达式爬虫的相关内容,主要简单介绍Python正则表达式爬虫,同时讲述常见的正则表达式分析方法,最后通过实例爬取作者的个人博客网站。希望这篇基础文章对您有所...
  • Eastmount
  • Eastmount
  • 2017-10-18 18:15:59
  • 7332

初用正则表达式爬取图片

#coding:utf-8 #导入正则模块 import re import urllib #获取网页 def getHtml(url): #打开该网页 page=urllib.url...
  • yedoubushishen
  • yedoubushishen
  • 2015-11-17 21:18:04
  • 2596

Python中运用正则表达式抓取网页图片

#!/usr/bin/python import re import urllib #获取网页信息 def getHtml(url):     page = urllib.urlopen(url) ...
  • ccy950903
  • ccy950903
  • 2015-09-23 21:43:55
  • 1680

图片爬虫程序

  • 2012年06月18日 00:56
  • 35KB
  • 下载

爬取百度贴吧图片

  • 2017年11月02日 16:54
  • 580B
  • 下载
收藏助手
不良信息举报
您举报文章:python使用正则爬取图片
举报原因:
原因补充:

(最多只允许输入30个字)