Python 3 抓取百度贴吧图片

原创 2015年07月09日 23:41:48
# -*- coding: utf-8 -*-
"""抓取贴吧图片"""

import urllib.request
from bs4 import BeautifulSoup 

def get_content(url):
    """取得页面内容"""
    html = urllib.request.urlopen(url).read()
    data = html.decode("UTF-8")
    return data

def get_image(html_doc):
    """贴吧图片在<img class="BDE_Image" ……> 标签下"""
    soup = BeautifulSoup(html_doc)
    i = 0
    for link in soup.find_all("img","BDE_Image"):
        i = i + 1
        link_img = link.get("src")
        urllib.request.urlretrieve(link_img, "%s.jpg" % i)
        print(link_img)

myurl = "http://tieba.baidu.com/p/3797994694"  
my_html_doc = get_content(myurl)
get_image(my_html_doc)
版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

Python 3来抓取网页

用Python来抓取网页是很容易的,前面也写过很多类似的内容,但在Python3.0中,内容多多少少有些不同,下面进行一下介绍.简单的抓取网页:view plainimport urllib.requ...
  • yatere
  • yatere
  • 2011-07-20 10:20
  • 1260

Python 3 抓取网页资源的 N 种方法

原文地址:Python 3 抓取网页资源的 N 种方法 作者:laoliulaoliu 1、最简单 import urllib.request response = ur...

python3 多页爬虫爬取百度贴吧帖子所有图片

逛博客,发现了python。说是人工智能开发的主要语言,所以就来了兴趣,打算抽空看看。网上找了教程觉得语法上,相较于.net和java反倒更简单点。基本语法看完,总要弄点东西吧

Python抓取百度贴吧壁纸图片

Python抓取百度贴吧壁纸图片

Python爬虫实战(1)——百度贴吧抓取帖子并保存内容和图片

最近在网上看了很多的爬虫脚本,写的参差不齐,但是其中有很多写的非常的优秀,代码质量很高,规范性也很好,很具有代表性,非常值得我们去学习!~ 之前的帖子中介绍过url,也就是网址,在我们抓取网页的过...

Python3 根据关键字爬取百度图片

介绍 一个可用好用的百度图片爬取脚本,唯一的不足就是这是单线程的 运行环境 Python3.6.0 写该脚本的原因:获取图片 创作过程有参考 源码# coding:utf-8 import requ...

python 3.x 与 2.x的区别

__doc__      __file__      __name__      _abcoll      _itemgetter&...

Python 3 collections.defaultdict() 与 dict的使用和区别

转自:http://www.cnblogs.com/herbert/archive/2013/01/09/2852843.html 在Python里面有一个模块collections,解释是数据类型容...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)