uipath studio/pro 中的操作对比上文稍微有些不同,下述均使用uipath studio pro.
Extract Table Data可以批量抓取网页数据或应用程序(如SAP)的数据,所抓取的数据如果是表格则可以直接被识别,对于非表格的数据需要多几步操作以抓取内容。在uipath studio 中Extract Table Data被替换为了Data Scraping
SAP表格数据抓取(非SAP表格同样适用)
下图是待抓取的ALV报表
在使用Data Scraping时,工具会提示你打开想要获取数据的浏览器,应用,文档或其他,然后点击下一步,鼠标点击一个需要获取数据的元素(如表格中的某一个单元格)
如果侦测到你选择的是一个表格类型的数据,工具会自动抓取所有表格内容如下图所示
随后可以在属性栏的output属性处接收一个datatable类型的上述表格返回值,可以使用filter对表格进一步筛取,存入到excel或用于其他操作。
非表格数据抓取
非表格数据抓取第一步都相同,还是首先开启你需要抓取数据的应用,点击下一步
bilibili搜索uipath的结果作为数据源,依次提取标题,分类,描述,发布时间
选取数据元素时先点击第一个标题“UIPATH官方教程”,选取完以后工具会弹出对话框,提示你为了找到数据提取的规律,你需要再选取一个同类别的数据
第二次我们选取第二个标题“第一课–UIpath安装与激活”,此时工具找到规律后会自动高亮我们需要抓取的标题元素,同时弹出对话框让你确认抓取的这一列元素,此时可以编辑列名,下方对话框红框圈起来的地方勾上,工具就会提取这个元素对应跳转的url链接
点击下一步之后,就可以看到抓取到数据的预览,点击红框的Extract Correlated Data,就可以重复上述步骤,抓取其他元素,finish结束数据抓取
点击finish结束元素抓取后,工具会询问你是否有多页可以抓取,yes会让你选择下一页的导航元素(不是下一页的数字,是下一页的导航栏,红框圈住的地方),no则结束数据抓取
此时非表格数据抓取结束,可以在属性栏获得datatable类型的返回值
写入范围到excel的效果(bilibili的下一页好像有点问题,建议去别的网站爬数据,人民日报跟51job的下一页都有效,可以继续往后爬取指定行数的数据)