下载堆糖图片-正则-xpath-BeautifulSoup-selenium-python爬虫

最新推荐文章于 2024-04-08 07:26:54 发布

洋芋本人

最新推荐文章于 2024-04-08 07:26:54 发布

阅读量201

点赞数

分类专栏： python项目练习文章标签： python 爬虫

本文链接：https://blog.csdn.net/weixin_43761516/article/details/114483553

版权

小项目-下载堆糖网页图片-python爬虫

这里是获取单单页的
要翻页的话找页面规律或者用selenium，但是这里的下一页按钮是js加载的，可以看到type的类型标有hidden，所以要用driver.execute_script()

一、正则

import requests
import re

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36'
}


class tuitangSpider():
    
    def __init__(self,name):
        self.name = name
        self.pic_links = []
        
        
    def getSource(self):
        url_base = 'https://www.duitang.com/search/?'
        params = {'kw':self.name,'limit':100}
        wb_data = requests.get(url_base,params=params,headers=headers).content.decode('utf-8')
        return wb_data
    
    
    def parseSource(self):
        tags = tags = re.findall('.*?div data-id(.*?)</div>.*?',self.get

最低0.47元/天解锁文章

洋芋本人

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
下载堆糖图片-正则-xpath-BeautifulSoup-selenium-python爬虫

小项目-下载堆糖网页图片-python直接批量下载网页图片，简单几步一、观察json代码从网页的检查进去，点击右箭头的地方后，再将光标锁定在图片上，右边就会对应的代码可以很容易的看出，每一张图片都存在以a开头的，带有img、有src属性的代码中，src接的内容就是图片链接地址二、下载图片链接## 要用到的包import requestsimport jsonfrom bs4 import BeautifulSoupurl=r'https://www.duitang.com/searc
复制链接

扫一扫