Python Scraping:通过 3 个简单步骤创建浏览器类

本文介绍如何创建一个Python Browser类用于Web Scraping,涵盖了设置、类创建及测试过程。通过这个类,可以执行HTTP(S)请求,处理数据和标头,同时保留会话信息。文章提供了一个简单的测试示例,展示类的实用性和灵活性。
摘要由CSDN通过智能技术生成

每当我决定创建一个宠物 Python 项目来抓取一些数据时,它总是从创建一个 Browser 类开始,该类实际上将数据发送到 Internet 并从 Internet 请求它。

在本文中,我将带您创建自己的 Browser 类,该类将涵盖 99% 的 Web Scraping 用例。

第 1 步:设置

我将使用 Python 3.7。

为了实际执行我们的 HTTP(S) 操作,我将使用该requests库(我使用的是 2.27.1 版本,但最新版本很可能可以正常工作)。

这几乎就是我们所需要的!

第 2 步:创建类

让我们开始写我们的Browser课程吧。当然,我们将从声明我们的新类并导入requests包开始:

import requests


class Browser:
  pass

在大多数 Web Scraping 情况下,您将使用其中一个GETPOST请求。对我们来说幸运的是,requestspackage 轻松地提供了这两种方法。

让我们在Browser类上定义允许调用访问这些方法的新方法:

import requests


class Browser:

  def get(self, url):
    return requests.get(url)
    
  def post(self, url, data=None):
    return requests.post(url, data=data)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值