UIPATH 数据提取

uipath studio/pro 中的操作对比上文稍微有些不同,下述均使用uipath studio pro.
Extract Table Data可以批量抓取网页数据或应用程序(如SAP)的数据,所抓取的数据如果是表格则可以直接被识别,对于非表格的数据需要多几步操作以抓取内容。在uipath studio 中Extract Table Data被替换为了Data Scraping
SAP表格数据抓取(非SAP表格同样适用)
下图是待抓取的ALV报表
在这里插入图片描述

在使用Data Scraping时,工具会提示你打开想要获取数据的浏览器,应用,文档或其他,然后点击下一步,鼠标点击一个需要获取数据的元素(如表格中的某一个单元格)
在这里插入图片描述

如果侦测到你选择的是一个表格类型的数据,工具会自动抓取所有表格内容如下图所示
在这里插入图片描述

随后可以在属性栏的output属性处接收一个datatable类型的上述表格返回值,可以使用filter对表格进一步筛取,存入到excel或用于其他操作。
非表格数据抓取
非表格数据抓取第一步都相同,还是首先开启你需要抓取数据的应用,点击下一步
bilibili搜索uipath的结果作为数据源,依次提取标题,分类,描述,发布时间
在这里插入图片描述

选取数据元素时先点击第一个标题“UIPATH官方教程”,选取完以后工具会弹出对话框,提示你为了找到数据提取的规律,你需要再选取一个同类别的数据
在这里插入图片描述

第二次我们选取第二个标题“第一课–UIpath安装与激活”,此时工具找到规律后会自动高亮我们需要抓取的标题元素,同时弹出对话框让你确认抓取的这一列元素,此时可以编辑列名,下方对话框红框圈起来的地方勾上,工具就会提取这个元素对应跳转的url链接
在这里插入图片描述

点击下一步之后,就可以看到抓取到数据的预览,点击红框的Extract Correlated Data,就可以重复上述步骤,抓取其他元素,finish结束数据抓取
在这里插入图片描述
在这里插入图片描述

点击finish结束元素抓取后,工具会询问你是否有多页可以抓取,yes会让你选择下一页的导航元素(不是下一页的数字,是下一页的导航栏,红框圈住的地方),no则结束数据抓取
在这里插入图片描述

此时非表格数据抓取结束,可以在属性栏获得datatable类型的返回值
写入范围到excel的效果(bilibili的下一页好像有点问题,建议去别的网站爬数据,人民日报跟51job的下一页都有效,可以继续往后爬取指定行数的数据)

在这里插入图片描述

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值