python爬虫——BeautifulSoup 抓取图片

python 利用BeautifulSoup 抓取图片

# -*- coding: utf-8 -*-
"""

"""
import urllib
from bs4 import BeautifulSoup
#beautifulsoup方法,第三方库的方法,爬找网页 
## 下载网页
def get_content(url):
    '''
    @url:需要下载的网址
    下载网址
    '''
    html = urllib.request.urlopen(url)
    content = html.read().decode('utf-8')#转码
    html.close()#记得要将打开的网页关闭,否则会出现意想不到的问题
#    print (type(content))
    return content

def get_image(info):
    '''
    利用Soup第三方库实现抓取
    '''
    soup = BeautifulSoup(info,'html.parser')#设置解析器为“lxml”
    all_image = soup.find_all('img',class_ = "BDE_Image")
    x=1  
    for image in all_image:
        print(all_image)
        urllib.request.urlretrieve(image['src'],"E:\\WORK\\py\\TensorFlow\\爬取树叶图片\\BS-Soup\\%s.jpg"%(x))
        x+=1

url = "https://tieba.baidu.com/p/5114003992" 
info = get_content(url)  
#print (info) 
get_image(info)

这里写图片描述

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值