python 爬网页动态元素里的图片

qq_45966200

已于 2024-05-30 15:47:48 修改

阅读量81

点赞数 3

文章标签： python

于 2024-05-30 15:46:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45966200/article/details/139326360

版权

from selenium import webdriver
from bs4 import BeautifulSoup
from urllib.parse import urlparse, urljoin
import time
import os
import requests

urlList=[]
for url in urlList:
    # 创建Chrome浏览器实例
    driver = webdriver.Chrome()

    uri=url.get('http')
    # 访问网页
    driver.get(uri)

    # 等待页面加载完成
    time.sleep(5)  # 根据需要调整等待时间

    # 获取页面源代码
    html_source = driver.page_source

    # 使用BeautifulSoup解析
    soup = BeautifulSoup(html_source, 'html.parser')
    tee_image_elements = soup.find_all(lambda tag: tag.name == 'img' and tag.get('class') == ['tee-image'])
    img_url1 = tee_image_elements[0].get('src')
    if img_url1:
        if img_url1.endswith("!large.webp"):
            img_url = img_url1[:-11]
            # 下载图片
            response = requests.get(img_url, stream=True)
            if response.status_code == 200:
                #更改名称
                parsed_url = urlparse(uri)
                img_folder = os.path.dirname(parsed_url.path)
                img_file_name = os.path.basename(parsed_url.path)
                img_file = img_file_name + ".jpg"

                # 图片保存路径，例如保存在当前目录下的`images`文件夹
                image_path = os.path.join("test_img", os.path.basename(img_file))
                with open(image_path, 'wb') as f:
                    for chunk in response.iter_content(1024):
                        f.write(chunk)

    # 关闭浏览器实例
    driver.quit()

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 爬网页动态元素里的图片

【代码】python 爬网页动态元素里的图片。
复制链接

扫一扫

qq_45966200 CSDN认证博客专家 CSDN认证企业博客

码龄5年

11: 原创

104万+: 周排名

9万+: 总排名

3887: 访问

: 等级

161: 积分

29: 粉丝

48: 获赞

4: 评论

27: 收藏

私信

关注

热门文章

最新评论

拉取ts一个小程序项目如何运行起来
CSDN-Ada助手: 恭喜您写了第7篇博客！阅读了您的文章，对拉取ts一个小程序项目如何运行起来有了更清晰的认识。接下来，建议您可以尝试分享一些关于小程序项目的优化技巧或者实用的开发工具，让读者可以更加高效地开发自己的小程序项目。希望您能继续保持创作的热情，期待您更多精彩的文章！
macOs使用docker部署nginx+php
ha_lydms: 我很感激作者为我们提供了这么多宝贵的知识，让我觉得自己变得更加丰富和有智慧。
叮叮机器人推送消息到叮叮群聊
CSDN-Ada助手: 恭喜你写了第6篇博客！看到你探讨叮叮机器人推送消息到叮叮群聊的内容，觉得很有意思。希望你能继续坚持创作，分享更多有趣的技术内容。或许下一步可以深入探讨如何优化机器人的推送策略，或者探讨其他类型的群聊机器人应用。期待你的更多精彩作品！
vue点击按钮复制内容
CSDN-Ada助手: 恭喜您发布了第三篇博客！看到您分享了关于vue点击按钮复制内容的教程，非常实用！希望您能继续坚持创作，为大家带来更多有价值的内容。下一步可以考虑分享一些关于vue的进阶技巧或者实战经验，让更多人受益。期待您的下一篇作品！祝您创作愉快！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
前端调用后端接口，导出excel文件打开显示[object object]
CSDN-Ada助手: 恭喜你开始了博客创作，这是一个很好的开端！关于你提到的前端调用后端接口导出excel文件显示[object object]的问题，我建议你可以深入研究一下前后端交互的过程，尤其是关于数据格式的处理和传输。或许你可以在下一篇博客中分享一些关于如何正确处理后端返回的数据并在前端正确显示的方法，这对很多人都会有帮助的。加油！期待你的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。