抓取唯美图库(BeautifulSoup)

该代码示例展示了如何利用Python的BeautifulSoup库解析HTML,获取子页面链接,再通过requests库下载子页面中的图片。首先从主页面抓取图片链接,然后对每个链接发起请求获取图片内容,最后将图片内容保存至本地。
摘要由CSDN通过智能技术生成

使用BeautifulSoup

 1、拿到主页面的源代码,然后提取到子页面的简介地址,href
 2、通过href拿到子页面的内容。从子页面中找到导图片的下载地址 img -> src
 3、下载图片 



import requests
from bs4 import BeautifulSoup

url='https://www.umei.cc/bizhitupian/weimeibizhi/'
resp = requests.get(url)
resp.encoding='utf8'  # 处理乱码
# print(resp.text)

main_page = BeautifulSoup(resp.text,"html.parser")
alist = main_page.find('div',class_="Clbc_r_cont").find_all("img", class_="box_div_yj")
# print(alist)
for a in alist:
    src = a.get('src')  # 可以通过get就可以拿到属性的值
    # print(src)
    # 下载图片
    img_resp = requests.get(src)
    # img_resp.content # 这里拿到的是字节
    img_name = src.split("/")[-1]  # 拿到url中的最后一个/以后的内容
    with open("img/"+img_name,mode='wb') as f:
        f.write(img_resp.content)  # 图片内容写入文件

    print("ovwe!!!",img_name)
print("all over!!!")

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值