Python中使用request爬取图片

在Python中使用request爬取图片,并保存。
需要注意的是,使用正则匹配时,可以先保存html的一页作为参考,再去对比图片链接的规则。

import re,requests
import os

url="https://www.4kbizhi.com"
headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.5112.81 Safari/537.36 Edg/104.0.1293.47"}
data1=requests.get(url=url,headers=headers)  #发送请求
data1.encoding='utf-8'  
print(data1.text)
if os.path.exists('./file')==False: #判断当前文件路径是否存在
     os.mkdir('./file')

def parse(data):
    urls = re.findall(r'<a href="/wallpaper/.*?.html" target="_blank" title="(.*?)"><img src="(.*?)" alt=".*?" />',data)      #(.*?)表示需要匹配的对象,可保存html文件的格式查看
    print(urls)#正则匹配,查找图片链接地址,类型为[(1,2)]这种,需要遍历
    for i in urls:  
        list='https://www.4kbizhi.com'+i[-1]   #前面加上前缀,-1为索引最后一个
        print(list)
        rs=requests.get(list,headers=headers)
        with open(f'./files/{i[-2]}.jpg','wb') as f:   #以wb类型保存,i[-2]为图片名称
            f.write(rs.content)

if __name__ == '__main__':
    parse(data1.text)
    for i in range(2,30):  
        url2 = f'https://www.4kbizhi.com/index_{i}.html'  #从第二页开始,地址变为index_n
        data2 = requests.get(url=url2, headers=headers)   #重新发送地址请求
        data2.encoding = 'utf-8'
        parse(data2.text)   #调用解析函数,要求是文本格式

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
使用Pythonrequests库取百度图片,您可以按照以下步骤进行操作: 1. 安装requests库:如果您还没有安装requests库,可以使用以下命令进行安装: ``` pip install requests ``` 2. 编写取代码:下面是一个简单的例子,演示如何使用requests库取百度图片的搜索结果: ```python import requests def download_images(keyword, num_images): # 构建百度图片搜索的URL search_url = f'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&word={keyword}&pn=0&rn={num_images}' # 发送GET请求 response = requests.get(search_url) # 处理响应结果 if response.status_code == 200: # 获取图片URL image_urls = [data['middleURL'] for data in response.json().get('data', []) if 'middleURL' in data] # 下载图片 for i, url in enumerate(image_urls): try: response = requests.get(url) with open(f'image{i}.jpg', 'wb') as f: f.write(response.content) print(f'Successfully downloaded image{i}.jpg') except: print(f'Failed to download image{i}.jpg') else: print('请求失败') # 要搜索的关键词和要下载的图片数量 keyword = 'cat' num_images = 10 # 执行取 download_images(keyword, num_images) ``` 在上述代码,我们构建了一个特定的URL,其包含了搜索关键词和要下载的图片数量。然后,我们发送GET请求来获取搜索结果,并解析响应结果图片URL。最后,我们使用requests库下载图片并保存到本地。 请注意,这只是一个简单的示例,实际应用可能需要更多的处理和错误处理。另外,取网站的图片可能需要遵守该网站的使用条款和法律法规。请确保遵守相关规定并尊重他人的权益。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值