python爬取百度图片并下载

最新推荐文章于 2022-01-28 09:46:36 发布

杉杉来吃·

最新推荐文章于 2022-01-28 09:46:36 发布

阅读量487

点赞数

分类专栏： python 文章标签：爬虫 python

本文链接：https://blog.csdn.net/qq_40351478/article/details/88966791

版权

python 专栏收录该内容

5 篇文章 1 订阅

订阅专栏

爬取百度贴吧图片

import requests
from bs4 import BeautifulSoup
import  urllib.request
def getHtml(url):# 爬取网页源代码
    # headers={
    #     "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko"
    # }
    response=requests.get(url)
    response.encoding=response.apparent_encoding # 设置编码
    return response.text

def getData(html):
    src=[]	# 存放图片src链接
    soup=BeautifulSoup(html,'html.parser')# BeautifulSoup解析
    imglist=soup.find_all('img')# 获取img图片集合
    lenth = len(imglist)  # 计算图片集合的个数
    for i in range(lenth):
        src.append(imglist[i].attrs['src'])# 获取src链接
    return src

if __name__ == '__main__':
    url="https://tieba.baidu.com/p/4803144798"
    html=getHtml(url)
    img=getData(html)
    imgName = 0 # 计数，下载图片个数
    for href in img:
        if href[0:4]=='http':   # 去除不规范src链接
            name = "G:\\images\\"+str(imgName)+".jpg"   # 图片保存地址及命名拼接
            conn = urllib.request.urlopen(href)
            f = open(name, 'wb')
            f.write(conn.read())    # 将图片写入磁盘
            f.close()
            imgName += 1
            print('正下下载第%s图片' % imgName)

杉杉来吃·

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python爬取百度图片并下载

爬取百度贴吧图片import requestsfrom bs4 import BeautifulSoupimport urllib.requestdef getHtml(url):# 爬取网页源代码 # headers={ # "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11...
复制链接

扫一扫

专栏目录