用rpa必须会用python语言_几步教你用 Python 制作一个 RPA 机器人！-CSDN博客

本文介绍了如何使用Python的Pyppeteer库来创建RPA机器人，以自动化处理固定流程的工作。文章讨论了RPA的概念，RPA工具的选择，以及为何选择Pyppeteer，包括其配置、异步处理、元素定位、截图、调试方法等，并给出了登录网站的实战案例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

那么我们能不能通过机器去自动完成这些固定流程且繁琐的工作呢？答案是肯定的。现阶段，我们可以通过引入 RPA 来实现整个流程的打通。

什么是 RPA

RPA 是机器人流程自动化的简称，听起来很高大上的名字，实际上本质就是自动化，让机器帮人去做一些流程固定的事情，机器可以 7* 24小时不停转的完成工作。但是人最多只能 996，毕竟还是要睡觉的，不能剥削的太狠。

RPA 工具选型

RPA 其实出现的时间不短，但是在国内兴起也就最近几年的事情，成熟的产品并不多，例如阿里云的RPA、国外的uiPath 等等，但是这些工具对于平台依赖性较大，他们只能部署在Windows 操作系统上，而我们希望部署在Linux 服务器上，在命令行模式下运行，这样可以节省资源。

基于此，我们决定通过 Python 来实现自动化，由于我们所需要对接的系统大部分都不会给我们提供现成的 API 接口，我们一开始通过 requests 来模拟登录获取coookies 进行请求，但是这个过程中发现很多页面都是异步加载数据，而 requests 是同步的，无法获取数据，且内部系统做了非常严格的认证鉴权，仅仅靠 requests、Beautiful Soup 等是搞不定这些鉴权的。因此我们需要一些工具来实现模拟浏览器请求爬取数据，对比了目前比较流行的几款开源的自动化工具:

Selenium：老牌自动化测试工具，优点是支持大部分主流浏览器，它提供了功能丰富的API接口，且支持浏览器无头模式，但是缺点也很明显，比如速度太慢、对版本配置要求严苛，最麻烦是经常要更新对应的驱动，每次浏览器升级都需要去重新安装 Chromedriver。

Puppeteer Puppeteer：是一个 Node 库，它提供了高级 API 来通过 DevTools 协议控制 Chrome 或 Chromium，简单理解成我们日常使用的 Chrome 的无界面版本，可以使用 js 接口进行进行操控。意味凡是 Chrome 浏览器能干的事情，Puppeteer 都能出色的完成。

RPAfor Python：这个是我们最开始使用的一款 RPA 工具，它可以很好的满足我们的需求，且操作也比较简单，通过 Xpath 定位元素就可以对 DOM 进行操作，但是其与 Selenium 有着相同的缺点即速度慢，且不支持浏览器无头模式运行，也就是说它需要一个桌面环境，对资源消耗较大，尤其是 Chromium 这种吃内存较大的程序。而我们希望将其部署到 Linux 服务器上去，所以 Rap for Python 也就无法满足需求了。

经过对比，最终我们选择了 Puppeteer 的 Python 版本 Pyppeteer 来作为 RPA 工具

Pyppeteer 是什么

Puppeteer(中文翻译”木偶”) 是 Google Chrome 团队官方的无界面(Headless)Chrome 工具，它是一个 Node库，提供了一个高级的 API 来控制 DevTools协议上的无头版 Chrome 。也可以配置为使用完整(非无头)的 Chrome。它非常适合前端开发者进行自动化测试，而我们除了使用这个自动化工具，还有一些其他功能是基于 Python 来开发的，比如使用pandas 处理表格，做数据分析，所以我们选择了一个社区维护的 Pyppeteer ，他的功能几乎和 Puppeteer 一样，所以即使是去看 Puppeteer 的文档也没多大问题。

puppeteer 可以做很多事情，简单来说你可以在浏览器中手动完成的大部分事情都可以使用Puppeteer完成！例如：

生成页面的截图和PDF。

抓取SPA并生成预先呈现的内容(即“SSR”)。

从网站抓取你需要的内容。

自动表单提交，UI测试，键盘输入等

创建一个最新的自动化测试环境。使用最新的Java和浏览器功能，直接在最新版本的Chrome中运行测试。

捕获您的网站的时间线跟踪，以帮助诊断性能问题。

开始使用 Pyppeteer

1.无头模式配置

在打开浏览器的时候，我们需要设定一些参数，如果你需要它跑在容器里面或纯字符模式的 Linux 中，则 headless 参数必须设置为 true，同时 args 中的参数也要加上，它主要是关闭Chrome 一些没有必要的功能，例如扩展、flash、音频和gpu等，以达到节省资源的目的，executablePath 可以指定浏览器的目录，默认 Pyppeteer 会自动去执行 Pyppeteer-install 来下载 Chromium，在国内下载极其慢，建议提前安装好 Chromium。

参数含义

2.异步编码

由于 Pyppeteer 是异步的因此在 Python 中需要使用async def 来增加方法。

3.注入cookie

在一些场合，我们需要与 requests 进行结合，因为整体上 requets 的效率和实现相对比较容易些，可以在必要的时候调用 Pyppeteer 唤起浏览器，因此可以通过设置cookie 来让 Pyppeteer 登录某个页面

4.阻塞

在一些场景，我们需要进行阻塞，比如说页面加载中，但是程序执行的很快，可能还没加载完就执行其他语句了，这样就拿不到想要的数据，这个时候可以使用page.waitFor 让页面进行等待，不要去使用 time.sleep

一些页面要善于使用 Page.waitFor。因为有些click 事件程序触发过短会无法唤起

5.定位元素

在获取页面某个标签内的元素是比较常用的方法，可以通过querySelector 先定位到元素，然后通过 page.evaluate 执行js 原生方法来拿到标签内的文本

6.截图

有时候我们需要对页面的某一段元素进行截图，我们可以使用page.J 先定位到元素，然后调用 screenshot 进行截图

截图的时候需要设置浏览器的分辨率

7.快速查找元素

很多时候我们不能通过 id、 class 来定位页面元素的具体路径，可以借助 Chrome 的开发者工具，对元素进行定位，快速的找到元素，而 Pyppeteer 提供了多种方式查找元素，如选择器、xpath

例如:

8.Page.waitFor

page.waitFor(selectorOrFunctionOrTimeout[, options[, …args]]) 下面三个的综合 API

page.waitForFunction(pageFunction[, options[, …args]]) 等待 pageFunction 执行完成之后

page.waitForNavigation(options) 等待页面基本元素加载完之后，比如同步的 HTML, CSS, JS 等代码

page.waitForSelector(selector[, options]) 等待某个选择器的元素加载之后，这个元素可以是异步加载的。

9.使用工具自动生成代码

如果你对编写这种枯燥乏味的元素定位感到厌烦，不妨试试Chrome 的插件 Puppeteer recorder ，他可以录制你的页面操作，当然很多时候并不是很准，但是通过它来辅助开发，可以大大提升你的开发效率。

10.执行程序

由于是异步的，因此我们需要通过异步的方式来调用，同时使用 loop的create_task 方法获取回调拿到返回值。

11.无头模式下的调试

在我们爬取一些网站时候发现在正常有Headless 的情况下可以得到最终的效果，但是在无头模式下会拿不到元素，提示超时。报类似下面这样的超时错误。

这种情况下我们可以通过上面说的截图的方式进行Debug，看下当前报错的页面是否与实际页面一致，建议配置上 User-Agent。因为某些情况下系统会把页面当成移动端来访问，导致获取到的页面元素与实际不一致。

12.pypuppet 整合 requests

很多时候，一些系统都会提供接口，如果我们能够直接请求这些接口，效率会更高，但是内部系统会使用非常严格的校验，普通的登录方式是走不通的。不过 pypuppet 可以帮我们绕过鉴权限制，并拿到对应系统的cookies。

当我们拿到 cookies 后我们就可以通过 requests 模拟 HTTP 请求了，这样在一些非异步加载的页面下可以直接爬取接口，节省了大量的时间和精力。

这里可以把缓存信息写到 Redis 中去，设置下过期时间，这样只需要在首次进行登录，后面直接读取cookies 进行请求，与此同时，一些网站的请求头中加了一些自定义的头，如果缺少这些头，则无法进行请求，这时候，我们可以通过page.on 来拦截请求或响应信息，例如抓取特定的url，拿到对应的 headers 将其进行缓存，然后读取 headers 信息放到请求头中去，完美的绕过鉴权。

13.服务器环境依赖

我们是将其部署在虚拟机上，由于单位提供的镜像非常精简，如果想让程序能够在无头模式下运行，只需要安装 Xvfb 即可，Xvfb是一个实现了X11显示服务协议的显示服务器。不同于其他显示服务器，Xvfb在内存中执行所有的图形操作，不需要借助任何显示设备。执行下面的命令即可安装：

然后默认centos 的源中是没有 Chromium 的，需要安装 epel-release 然后执行：

接着就可以部署到服务端运行了。

不过需要注意了，如果你的服务器没有安装中文字体。Chromium 中会显示方块字。这个时候只需要安装上对应的中文字体就行

案例演示

下面是一个使用 pyppeteer 登录某网站，我们可以看到这个网站需要输入手机号、密码还有

那么我们怎么使用 Pyppeteer 开完成呢？

定义一个函数用户打开网站，输入用户名和密码以及验证码 page.type 中的元素地址，我们可以参考上面快速查找元素部分来通过chrome 开发者模式调试获取元素路径，我们可以看到这个网站他的id 为 userLoginCode 的 input 有2个，但是他们的name 是不一样的，所以我们可以这样去选择。

下面是这个登录函数的代码：

通过上述方式我们登录成功后，就可以拿到cookies。并可以通过定义一个 Session，然后去请求啦。

好了，以上就是关于使用Python 制作 RPA 机器人的分享。