用UiPath实现网页抓取——表格数据提取-1-单击选择分类-ISO标准化-01-综合、术语、标准化、文献目录获取

本文介绍了如何使用UiPath自动化工具抓取全国标准信息公告服务平台的ISO标准化数据,包括手动过程和步骤详细的UiPath操作,如选择分类、状态、数据提取及多页面处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用UiPath实现网页抓取——表格数据提取-1-单击选择分类-ISO标准化-01-综合、术语、标准化、文献目录获取

1.下载前的准备

准备获取目录的链接是
全国标准信息公告服务平台链接: https://std.samr.gov.cn/search/iso?tid=&q=
在这里插入图片描述

2.手动获取数据的过程

第一步,标注啊类型选择——ISO
第二步,标准化状态选择——现行
第三步,ICS分类选择——01_综合、术语标准化、文献
在这里插入图片描述
在这里插入图片描述
将数据分别复制到excel文件中,如下图。
由于国际标准分类号在UiPath的实际操作过程中分成了两列进行获取,所以我们在excel中设置了两列,当数据获取后再进行合并就可以了。
在这里插入图片描述

3.用UiPath网页抓取

第一步,新建一个流程
在这里插入图片描述
在这里插入图片描述
第二步,选择使用浏览器,并选择需要获取数据的链接
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
获取到浏览器的链接
在这里插入图片描述
第三步,选择文件的分类选项
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

①选择点击的对象是——ISO 选择锚点是——标准类型
②选择点击的对象是——现行 选择锚点是——标准状态
③选择点击的对象是——01-综合、术语、标准化、文献 选择锚点是——标准状态
在这里插入图片描述
第四步,选择表格数据提取在这里插入图片描述
获取数据并重命名
在这里插入图片描述

在这里插入图片描述
如果要获取多个页面中的数据,选择从多个页面提取数据为是
选择下一页的按钮
在这里插入图片描述
如果遇到页码和下一页按钮不能显示的问题,将谷歌中的页面放大即刻看到页码和下一页
在这里插入图片描述
在这里插入图片描述
点击设置,设定最大行数为多少或者最大页数为多少
在这里插入图片描述

在这里插入图片描述

第五步,写入范围 Workbook

在这里插入图片描述
在这里插入图片描述

填excel文件名和表单名
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
完整流程如下图
在这里插入图片描述

第六步,调试文件获取目录
注意:在调试文件前关闭浏览器
在这里插入图片描述
下载完成
在这里插入图片描述
获取到的目录
在这里插入图片描述
添加每列的标题即可
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值