bs4爬取网站图片

import requests
import bs4
#请求的路径
baseUrl='http://imgur.com'
#在本地创建一个目录 =文件名
# dirName='image'
#创建
# os.makedirs(dirName,exist_ok=True)
#完整的请求地址
url=baseUrl+"/search/score?q="+"movie"
#请求这个网页
response=requests.get(url)
#检查这个网页是否请求成功了
response.raise_for_status()
# print('打印的text;'+response.text+':结束的地方')
#BeautifulSoup   1、遍历文档树    2、搜索文档树
soup=bs4.BeautifulSoup(response.text,"html.parser")
# print(soup)
#已经获取到image图片标签了
imageURLS=soup.select(".image-list-link img")
# print(imageURLS)
num=1
if not imageURLS:
    print("没有找到图片!")
else:
    for imageURL in imageURLS:

        #获取图片路径的节点
        downloadUrl=imageURL.get('src')
        # print(downloadUrl)
        imageStream = requests.get("http:" + downloadUrl)
        # print(imageStream.content)
        num += 1  # 循环一次加一
        yuan = imageStream.content  # 得到你图片的内容
        # print(yuan)
         #写进本地
        with open('E:\\out\\' + str(num) + '.jpg', 'wb') as f:
            print("正在写入第%d张" % num)
            f.write(yuan)  # 写进去
            f.close()  # 关闭文件

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值