记录 BeautifulSoup 一些使用方法

from bs4 import BeautifulSoup
import requests

def paginate(url_template, page_num):
    url = url_template.format(page_num)
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')
    # 在这里处理当前页面的内容
    divs = soup.find_all('div', class_='relative') # 限制class_='relative'
    for div in divs:
        links = div.find_all('a')
        for link in links:
            print(link.get('href'))
            # thread=threading.Thread(target=download_images, args=(link.get('href'),)).start()
            # threads.append(thread)
            # sleep(30)
            download_images(link.get('href'))
# 定义页面模板和起始页码
url_template = 'https://xxx.net/search?kw=xxx&page={}'

获取有多少页的代码 多少个翻页按钮

    #获取有多少页
    span = soup.find('span', class_='relative z-0 inline-flex flex-wrap shadow-sm rounded-md')
    if span:
        a_links = span.find_all('a')
        num = len(a_links)
        print(f"当前链接共有{num}页")

查找指定图片链接代码

       image_links = [img['src'] for img in soup.find_all('img', class_='block my-1')]
       image_names = [img['title'] for img in soup.find_all('img', class_='block my-1')]
  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值