python:bs4爬取奥特曼,是不是所有奥特曼都长一样

本文介绍了使用Python的BeautifulSoup和requests库爬取奥特曼粉丝联盟网站上的奥特曼图片。通过封装爬虫类,详细展示了爬取过程,并通过结果反驳了‘所有奥特曼都长一样’的观点,强调了多样性。代码注释清晰,适合有一定Python基础的读者学习。
摘要由CSDN通过智能技术生成

利用python+bs4爬取奥特曼粉丝联盟的奥特曼图片,难点把其实也没有,就是爬虫不经常搞,容易忘记一些东西。废话不多说,直接上代码

主要引包

import os
from pathlib import Path
from bs4 import BeautifulSoup
from requests import Session

  • os模块在这里的功能就是判断路径是否存在的
  • pathlib模块主要是获取路径用的
  • BeautifulSoup就是解析库,也是主要的爬取数据库
  • requests库调用了Session(类似一个浏览器),主要用于请求获取页面的

代码整合

import os
from pathlib import Path
from bs4 import BeautifulSoup
from requests import Session



class UltramanCrawling:

    def __init__(self):
        self.s = Session()
        self.s.headers.update(
            {"User-Agent": "Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:94.0) Gecko/20100101 Firefox/94.0"})

    def request_url(self, url):
        """
        返回解码后,然后再解析的html树
        :param url:
        :return:
        """
        response = self.s.get(url=url)
        
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值