Python实操网站图片爬虫自动下载

本文介绍了如何使用Python的requests库和正则表达式从指定网页抓取图片链接,然后下载图片保存到本地。
摘要由CSDN通过智能技术生成
import requests
import re

url = f'http://www.netbian.com/index_2.htm'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36',
}
response = requests.get(url=url, headers=headers)
response.encoding = response.apparent_encoding
# print(response.text)
img_info = re.findall(
    '<a href="(.*?)" title=".*?" target="_blank"><img src=".*?" alt="(.*?)" />.*?</a>', response.text)
for link, title in img_info:
    link_url = 'http://www.netbian.com'+link
    html_data = requests.get(url=link_url, headers=headers)
    html_data.encoding = html_data.apparent_encoding
    print(html_data.text)
    img_url = re.findall(
        'target="_blank"><img src="(.*?)" alt=".*?" title=".*?">', html_data.text)[0]
    img_content = requests.get(url=img_url, headers=headers).content
    with open('img//'+title+'.jpg', mode='wb') as f:
        f.write(img_content)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值