automa插件使用的一些实战经验1

automa,我承认我写不出来这样的代码,早年的时候公司想过做一个爬虫的工具,那个时候RPA还没有火,虽然下载也没怎么火.RPA再牛,还是需要工程师,想一点经验都没有人来做,还是理解不了。能够简化数据采集,却不能替换工程师。
1 循环数据问题
如果我想采集的数据,告诉我每页有多少条记录,或者有多少分页,就很容易了。
它这个里面循环数据的选项,除了变量,其他的都无法实现非固定值的分页。
1
但实际并不是我所想的那样使用。取元素的数量好办,通过js就可以得到

// 得到目录数量
const dir_cn = document.querySelectorAll('.file-list-item').length
automaSetVariable('dir_cn', dir_cn)

得到了数量如何循环呢?先调整思路,从循环元素着手,官方有个示例Extract All Instagram Profile Posts
指定要循环的元素,这里要循环的最大数据,就需要设置了,默认为0,这样循环就可以自动进行。
1
再取元素的属性值,获取超链接的href,可以看到这里的css选择器的使用规则,采用的是上面定义的first,得到值赋值给变量url
1
2 文件下载
飞书中文件有一个下载为“FreeMind”,这个用automa怎么操作呢?chrome浏览器 调试鼠标悬停后出现的元素样式,这里通过把鼠标放到对应元素,然后点击鼠标右键,同时按键盘上的N可以定位到悬浮窗口的dom节点,只是这种办法鼠标一挪走,就得反复这么操作,有些麻烦,多搞几次就好了。两个同时按,就不会隐藏掉,就容易定位到了。
2
前面两级菜单都好办,通过元素就可以找到,但是点击“FreeMind”,就有问题,因为它是文件下载。点击没有用
1
经过尝试,采取下面的方案,再最后的点击位置,再做一次悬停,然后点击元素,问题就可以解决了
1
有的时候看似css选择是有效的,但实际运行却很奇怪,找不到对应的元素。于是就需要用到非常规选择器,如下面,根据文本找到确切的下载对应的浮动元素。这个实践中发现的问题,可能是网页改版了,据我上次写已经过去快4个月了。

li.ud__menu-normal-submenu > div:contains("下载")

3 执行子工作流
当业务流程较为复杂,则采取子工作流的模式,这个怎么搞,如果再一个文件里面,眼花缭乱又不好维护。
1
执行工作流使用起来还是挺简单,但是我之因为调整了workflow.js中的源码,讲这段代码注释掉了,

      if (isFirstTime) {
        localWorkflows = firstWorkflows.map((workflow) =>
          defaultWorkflow(workflow)
        );
        await browser.storage.local.set({
          isFirstTime: false,
          workflows: localWorkflows,
        });
      }

却而代之的是,子流程就无法执行.

      // const response = await fetchApi(`/piFlowFile/selectAll`, {
      //   auth: true,
      //   method: 'get',
      // });
      // const res = await response.json();
      // if (res.success){
      //   let wfs = JSON.parse(res.data)
      //   localWorkflows = wfs.map((workflow) =>
      //     defaultWorkflow(workflow)
      //   );
      //   browser.storage.local.set({
      //     isFirstTime: true,
      //     workflows: localWorkflows,
      //   });
      //   this.workflows = convertWorkflowsToObject(localWorkflows);
      // }

在执行工作流哪里选择子流程是那个,给子流程传入变量即可.执行id不需要填写,这个id在js变成启动工作流的时候有用,但是这里不需要
1
进入到子工作流中,新建标签页中填写从主流程传过来的变量参数url,取法是{{variables.url}},勾上"等待标签页加载完毕",同时设置延迟时间,因为我这里点击元素是为了下载文件,如果不设置这些,页面就关闭,那么文件就不来不及下载.因此这些配置是需要的
1
4 子流程数据处理的问题
在子流程中设置数据,有一个问题,就是如果是在循环中,设置的参数怎么返回给主流程,这是个问题,最简单的办法是在主流程操作,子流程中我还没想好怎么弄,下面的方式会产生很多文件,这是不对的.
1
调整方案,在js中定义变量,然后设置变量自增1,这个增加变量并没有随着循环而累加,调试我发现就增加了一次,不过有了这个就够了,我根据变量是否>0,而从输出文档.避免了无效的文件生成.
1
还有一种办法并不是通过js来变成定义变量,而是采用如下图,使用插入数据模块定义变量,注意变量的定义应该在循环体外。
1
如下图在循环体外定义,这个学过变成的人都懂
1

5 滚动元素使用
飞书上我的空间里面的文章并不是表格,而是采用了下拉分页,因此需要采用滚动元素来操作,
如果采取默认的css选择器,在实际应用是不行的,因为是表格下拉,而不是整页下拉.重复次数并不能解决问题,因为谁说重置任务次数就是为3的.
1
换一种思路,采用while组件
1
设置终止元素,如果没有发现就循环下去
1
这里再扩展一下,因为我验证过,原来想先把页面滚到最下面,然后再一个个遍历行数据,但并不通,因为每次分页,下一页就会把上一页的数据覆盖掉,因此获取到的当前页数都是固定数量,因此需要再滚动元素之间,将你想要做的事情做了.例如下图:
3
6 遍历问题
爬虫最麻烦的还是遍历问题,采用广度优先,还是深度优先.是个问题.从入口进去,有些是目录,有些是列表,目录就就去,进去之后是同样的问题.最简单的办法,就是把所有的东西遍历一边,把链接是文件的,保存起来,然后在一个个打开.不过如果这样的话,会不会显得工程师没有什么水平呢?
如果采取最简单的方式,在下图如果判定时目录的时候,再进入到循环元素,经过验证后,这个是有问题的,因为在验证文本的的时候,这个地方,循环还是上一个页面的元素。
1
这是第一次的循环
1
这是第二次的循环,第二次新页面已经代开,但是loopData@dir获取的值,还是上一次的数据。因此上面的设计是不合理的。大概的判断应该还是在同一个循环体中。
2
如果把目录的数据存起来,然后遍历这个目录数据会怎样呢?为了少走弯路,于是翻阅官网网站上别人给的示例,在这个过程中也发现一些有意思的东西.
如下图通过$last关键字可以获取最后一条记录的数据
1
因为automa插件使用的是vue技术,因此可以看到他支持的js取值可以这么写
1
遍历的时候如果出现链接重复,可以通过js代码实现去重

// 提取变量中的链接
let urls = automaRefData('variables', 'liked_urls');

// 列表元素去重
function onlyUnique(value, index, array) {
  return array.indexOf(value) === index;
}
var unique_urls = urls.filter(onlyUnique);

// 更新变量
automaSetVariable('liked_urls', unique_urls);

继续探索,既然这种工具性产品,万不得已是可以不用写js的,因此再利用原生的模块。
将是目录的链接保存起来。然后在插入数据,接着再从数组取出数据,然后再循环,是否可以呢?
1
插入数据模块,采用是下面的写法,取文件链接变量folders的第一个值
1
接着利用切片变量,将使用过的链接从数组中删掉。注意开始序列是1。
1
接下来通过链接打开的是切换标签页,不是新建标签页,验证过新建标签页是不能达到想要的效果。
切换标签页的配置项如下红色方框设置。经过几个页面居然成功了。
1
接下来采用全量模式进行验证看看,如下图这样一个复杂的流程,经过十几个页面级循环,下载了132项文件,进入到一个也页面报错,但是单独执行又可以,现在还得调试看问题在哪里,真实是要想说国粹了。
1
根据报错的页面,向上追溯两三级,然后再验证,这样可以减少定位的范围。接着再可能存在异常的地方打断点调试,结果发现分布调试,运行是可以输出结果的,那么问题是不是那个地方应该设置延迟,或者是因为没有加载出来导致的?于是选择最有可能出问题的,切换标签页后面加一个元素存在的判断,如果某个元素没有加载出来,那么再循环等待直到元素出现,后面再加一个延迟,就不怕出不来。结果果然可以。
1

  • 14
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: AutoMA(自动运维管理系统)是一种用于管理和自动化IT运维流程的工具。它可以帮助组织更高效地管理软件和硬件资源,并减少人工干预。 AutoMA可以实现以下功能: - 资产管理:自动发现网络中的设备,并跟踪其配置和状态。 - 监控:通过收集系统性能数据和事件日志来监控网络和服务的健康状况。 - 自动化:通过设置规则和工作流来自动执行常见运维任务,如软件升级和故障恢复。 - 报告:生成关于网络和服务性能的报告,以帮助管理员了解和解决问题。 AutoMA通常作为一个独立的软件系统运行,但也可以作为其他IT管理工具的插件或模块使用。 ### 回答2: Automa是一个功能强大且易于使用的Python库,用于自动化Web浏览器和桌面应用程序的交互。它可以模拟用户在浏览器中的操作,例如点击链接、填写表单、提交数据等。 Automa使用非常简单。首先,需要安装Automa库。可以通过pip命令在命令行中输入“pip install automa”来安装。安装完成后,可以在Python代码中导入Automa库并创建一个Automa对象。 创建Automa对象后,可以使用对象的方法来模拟浏览器操作。例如,可以使用click()方法来点击链接或按钮,可以使用type()方法来填写文本字段,可以使用submit()方法来提交表单等。 Automa还提供了一些其他有用的方法,例如wait()方法可以使程序等待一段时间,直到某个元素出现在页面上;find()方法可以通过选择器查找页面上的元素。这些方法可以帮助我们在自动化的过程中进行条件判断和元素定位。 Automa还支持与桌面应用程序的交互。可以使用类似的方法来模拟鼠标点击、键盘输入等操作。通过与桌面应用程序的交互,可以实现一些复杂的自动化任务,例如自动打开应用程序、执行特定的操作、截取屏幕截图等。 总之,Automa是一个非常实用的自动化工具,可以帮助开发人员简化Web浏览器和桌面应用程序的自动化任务。它提供了简洁的API和丰富的功能,使得自动化任务变得更加容易实现和维护。无论是简单的浏览器操作还是复杂的桌面应用程序交互,Automa都可以提供有效的解决方案。 ### 回答3: Automa 是一种自动化工具,用于在 Windows 操作系统下进行图形用户界面 (GUI) 的自动化操作。它可以模拟用户的键盘输入和鼠标操作,实现自动执行重复任务或自动化测试。下面是 Automa 的详细介绍。 Automa 的主要特点包括以下几个方面: 1. 简单易用:Automa 提供简洁直观的 API,使得编写自动化脚本变得简单和容易上手。即使是没有编程经验的用户也可以快速上手。 2. 图形界面操作:Automa 可以模拟各种鼠标点击、移动、拖拽等操作,同时支持键盘输入,可以实现对 GUI 界面的完全模拟操作。 3. 文本识别:Automa 提供文本识别功能,可以识别图像中的文本,实现自动化文本操作,例如自动填写表单、读取文本内容等。 4. 图像识别:Automa 还提供图像识别功能,可以通过识别特定的图像区域来实现自动化操作。这对于处理一些没有文字标识的 GUI 界面非常有用。 5. 自动化测试:Automa 可以用于自动化测试,可以记录用户的操作序列并自动生成测试脚本,以便重复执行测试,节省时间和精力。 6. 多语言支持:Automa 支持多种编程语言,包括 Python、C#、Java 等,方便开发人员根据自己的喜好选择合适的语言进行开发。 总的来说,Automa 是一个功能强大且易于使用的自动化工具,可以帮助用户自动执行重复的任务和自动化测试。无论是普通用户还是开发人员,都可以通过 Automa 来提高工作效率,节省时间和精力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

warrah

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值