bs4爬取网站图片

最新推荐文章于 2024-08-27 08:53:23 发布

王小波_Libo

最新推荐文章于 2024-08-27 08:53:23 发布

阅读量2.4k

点赞数 1

分类专栏： # Python小项目

本文链接：https://blog.csdn.net/qq_38900441/article/details/86686763

版权

Python小项目专栏收录该内容

21 篇文章 3 订阅

订阅专栏

import requests
import bs4
#请求的路径
baseUrl='http://imgur.com'
#在本地创建一个目录 =文件名
# dirName='image'
#创建
# os.makedirs(dirName,exist_ok=True)
#完整的请求地址
url=baseUrl+"/search/score?q="+"movie"
#请求这个网页
response=requests.get(url)
#检查这个网页是否请求成功了
response.raise_for_status()
# print('打印的text;'+response.text+'：结束的地方')
#BeautifulSoup   1、遍历文档树    2、搜索文档树
soup=bs4.BeautifulSoup(response.text,"html.parser")
# print(soup)
#已经获取到image图片标签了
imageURLS=soup.select(".image-list-link img")
# print(imageURLS)
num=1
if not imageURLS:
    print("没有找到图片！")
else:
    for imageURL in imageURLS:

        #获取图片路径的节点
        downloadUrl=imageURL.get('src')
        # print(downloadUrl)
        imageStream = requests.get("http:" + downloadUrl)
        # print(imageStream.content)
        num += 1  # 循环一次加一
        yuan = imageStream.content  # 得到你图片的内容
        # print(yuan)
         #写进本地
        with open('E:\\out\\' + str(num) + '.jpg', 'wb') as f:
            print("正在写入第%d张" % num)
            f.write(yuan)  # 写进去
            f.close()  # 关闭文件