关闭

Python 3 抓取百度贴吧图片

标签: python
205人阅读 评论(0) 收藏 举报
分类:
# -*- coding: utf-8 -*-
"""抓取贴吧图片"""

import urllib.request
from bs4 import BeautifulSoup 

def get_content(url):
    """取得页面内容"""
    html = urllib.request.urlopen(url).read()
    data = html.decode("UTF-8")
    return data

def get_image(html_doc):
    """贴吧图片在<img class="BDE_Image" ……> 标签下"""
    soup = BeautifulSoup(html_doc)
    i = 0
    for link in soup.find_all("img","BDE_Image"):
        i = i + 1
        link_img = link.get("src")
        urllib.request.urlretrieve(link_img, "%s.jpg" % i)
        print(link_img)

myurl = "http://tieba.baidu.com/p/3797994694"  
my_html_doc = get_content(myurl)
get_image(my_html_doc)
0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:716次
    • 积分:46
    • 等级:
    • 排名:千里之外
    • 原创:4篇
    • 转载:0篇
    • 译文:0篇
    • 评论:0条
    文章分类
    文章存档