Python Scraping：通过 3 个简单步骤创建浏览器类

最新推荐文章于 2023-12-17 10:57:18 发布

mopanchun

最新推荐文章于 2023-12-17 10:57:18 发布

阅读量328

点赞数

文章标签： python 开发语言

本文链接：https://blog.csdn.net/mopanchun/article/details/127804102

版权

本文介绍如何创建一个Python Browser类用于Web Scraping，涵盖了设置、类创建及测试过程。通过这个类，可以执行HTTP(S)请求，处理数据和标头，同时保留会话信息。文章提供了一个简单的测试示例，展示类的实用性和灵活性。

摘要由CSDN通过智能技术生成

每当我决定创建一个宠物 Python 项目来抓取一些数据时，它总是从创建一个 Browser 类开始，该类实际上将数据发送到 Internet 并从 Internet 请求它。

在本文中，我将带您创建自己的 Browser 类，该类将涵盖 99% 的 Web Scraping 用例。

第 1 步：设置

我将使用 Python 3.7。

为了实际执行我们的 HTTP(S) 操作，我将使用该requests库（我使用的是 2.27.1 版本，但最新版本很可能可以正常工作）。

这几乎就是我们所需要的！

第 2 步：创建类

让我们开始写我们的Browser课程吧。当然，我们将从声明我们的新类并导入requests包开始：

import requests


class Browser:
  pass

在大多数 Web Scraping 情况下，您将使用其中一个GET或POST请求。对我们来说幸运的是，requestspackage 轻松地提供了这两种方法。

让我们在Browser类上定义允许调用访问这些方法的新方法：

import requests


class Browser:

  def get(self, url):
    return requests.get(url)
    
  def post(self, url, data=None):
    return requests.post(url, data=data)

最低0.47元/天解锁文章

mopanchun

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫