python爬虫——BeautifulSoup 抓取图片

最新推荐文章于 2023-06-06 21:36:36 发布

Nani_xiao

最新推荐文章于 2023-06-06 21:36:36 发布

阅读量9.5k

点赞数 1

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/xiao_lxl/article/details/77477994

版权

Python 专栏收录该内容

31 篇文章 3 订阅

订阅专栏

python 利用BeautifulSoup 抓取图片

# -*- coding: utf-8 -*-
"""

"""
import urllib
from bs4 import BeautifulSoup
#beautifulsoup方法，第三方库的方法，爬找网页 
## 下载网页
def get_content(url):
    '''
    @url:需要下载的网址
    下载网址
    '''
    html = urllib.request.urlopen(url)
    content = html.read().decode('utf-8')#转码
    html.close()#记得要将打开的网页关闭，否则会出现意想不到的问题
#    print (type(content))
    return content

def get_image(info):
    '''
    利用Soup第三方库实现抓取
    '''
    soup = BeautifulSoup(info,'html.parser')#设置解析器为“lxml”
    all_image = soup.find_all('img',class_ = "BDE_Image")
    x=1  
    for image in all_image:
        print(all_image)
        urllib.request.urlretrieve(image['src'],"E:\\WORK\\py\\TensorFlow\\爬取树叶图片\\BS-Soup\\%s.jpg"%(x))
        x+=1

url = "https://tieba.baidu.com/p/5114003992" 
info = get_content(url)  
#print (info) 
get_image(info)

这里写图片描述

Nani_xiao

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
python爬虫——BeautifulSoup 抓取图片

python 利用BeautifulSoup 抓取图片# -*- coding: utf-8 -*-""""""import urllibfrom bs4 import BeautifulSoup#beautifulsoup方法，第三方库的方法，爬找网页 ## 下载网页def get_content(url): ''' @url:需要下载的网址下载网址
复制链接

扫一扫

专栏目录