Python 3 抓取百度贴吧图片

原创 2015年07月09日 23:41:48
# -*- coding: utf-8 -*-
"""抓取贴吧图片"""

import urllib.request
from bs4 import BeautifulSoup 

def get_content(url):
    """取得页面内容"""
    html = urllib.request.urlopen(url).read()
    data = html.decode("UTF-8")
    return data

def get_image(html_doc):
    """贴吧图片在<img class="BDE_Image" ……> 标签下"""
    soup = BeautifulSoup(html_doc)
    i = 0
    for link in soup.find_all("img","BDE_Image"):
        i = i + 1
        link_img = link.get("src")
        urllib.request.urlretrieve(link_img, "%s.jpg" % i)
        print(link_img)

myurl = "http://tieba.baidu.com/p/3797994694"  
my_html_doc = get_content(myurl)
get_image(my_html_doc)

Python 3 多线程下载百度图片搜索结果

转载自http://lovenight.github.io/2015/11/15/Python-3-多线程下载百度图片搜索结果/ 今天来搜一搜「他」:百度图片搜索结果。 下载简单页面 查看网...
  • ujsDui
  • ujsDui
  • 2017年11月29日 20:49
  • 52

Python 3 多线程下载百度图片搜索结果

Python 3 实现下载百度图片搜索结果转载来至:http://lovenight.github.io/2015/11/15/Python-3-%E5%A4%9A%E7%BA%BF%E7%A8%8B...

Python 3 爬虫之批量下载字帖图片

朋友想下载这62个网页中的字帖图片:http://www.yac8.com/news/11003.html 一、要点 1. Chrome 「审查元素」中看到的源代码与真实的源码不同。 2. 图...

Python 3 色情图片识别

Python 3 色情图片识别 一、实验简介 本实验将使用 Python3 去识别图片是否为色情图片,我们会使用到 PIL 这个图像处理库,会编写算法来划分图像的皮肤区域 1.1. ...

零基础自学用Python 3开发网络爬虫(五): 使用第三方模块快速抓取与解析

点击进入本系列目录 在前面的四篇文章中, 我们一直采用 python 3 自带的 urllib  模块来抓取网页, 然后用 re 模块来处理抓取到的数据. 这次我们使用 Requests 库来代替 ...

Python 3 抓取网页资源的 N 种方法

1、最简单 import urllib.request response = urllib.request.urlopen('http://python.org/') html = resp...

Python 3来抓取网页

用Python来抓取网页是很容易的,前面也写过很多类似的内容,但在Python3.0中,内容多多少少有些不同,下面进行一下介绍.简单的抓取网页:view plainimport urllib.requ...
  • yatere
  • yatere
  • 2011年07月20日 10:20
  • 1314

Python 3 抓取网页资源的 N 种方法

原文地址:Python 3 抓取网页资源的 N 种方法 作者:laoliulaoliu 1、最简单 import urllib.request response = ur...

python3 多页爬虫爬取百度贴吧帖子所有图片

逛博客,发现了python。说是人工智能开发的主要语言,所以就来了兴趣,打算抽空看看。网上找了教程觉得语法上,相较于.net和java反倒更简单点。基本语法看完,总要弄点东西吧...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Python 3 抓取百度贴吧图片
举报原因:
原因补充:

(最多只允许输入30个字)