RPA-亚马逊商品评论采集。

背景

需求来源:跨境电商客户需要对指定商品的评论进行监控,该应用为上述场景的自动化实现

所属行业:电商

前置条件

暂无

亚马逊网址:Amazon.cn

操作流程

1. 第一步:循环模板表格中的商品链接,前往相应的商品详情页

2. 第二步:抓取页面上的文字元素

1)商品无评论

2)商品评论较少,无【查看全部xx条商品评论】按钮

3)商品评论较多,点击【查看全部xx条商品评论】进入评论页获取,并根据采集数量判断是否需要点击下一页

4)采集数量大于实际评论数量,下一页按钮置灰,直接退出循环

3. 第三步:下载评论图片/视频

若采集范围选中了下载评论图片或下载评论视频,且评论中含有图片或视频,则在指定文件夹中新建一个文件夹,命名为亚马逊商品评论附件,将图片或视频下载到该文件夹中,且将本地路径写入到结果文件的【评论图片/视频】列(命名可以自定义,如1.jpg,2.mp4,只要不重复就行)

4. 第四步:表格处理+网页关闭

将数据都写入结果文件后,处理表格样式

关闭打开的网页,运行完成后最小化浏览器窗口

3.结果展示

 该RPA是通过自然机器人RPA产品软件完成,所属也是自然机器人。欢迎大家了解自然机器人。

主要代码:

1,获取excel文件

            try:
                pass
                if param_value_1 != None and os.path.splitext(param_value_1)[1] not in [".xlsx", ".xls", ".xlsm", ".xlsm"]:
                    raise Exception('模板文件名不正确')
                if not os.path.exists(os.path.dirname(param_value_1)):
                    raise Exception('模板文件所在目录不存在')
                if  os.path.exists(param_value_4) !=True:
                    raise Exception('文件夹路径不存在')
                if hasattr(ntr.app, 'office'):
                    excel_obj_2 = ntr.app.office.excel.open(param_value_1, visible=True, readonly=False, password=r"",write_password=None, dispatch="auto")
                else:
                    excel_obj_2 = ntr.app.microsoft.excel.open(param_value_1, visible=True, readonly=False, password=r"",write_password=None)
                file_path_1 = param_value_1
            except(SDKError,Exception) as e:
                pass
                error = '{0}'.format(e)
                logger.error('Error-打开Excel-出现异常 ' + error)
                Debug_Block_Error('Error-打开Excel-ooown9092t6z', error, True)
                sys.exit(1)

2,获取excel文件信息

try:
                sheet_obj_2 = excel_obj_2.get_sheet()
                cell_row_cnt_1 = sheet_obj_2.row_count()
                iamrko = sheet_obj_2.read(r"A" + str(2) + ":" + r"A" + str(cell_row_cnt_1))
                iamrko = sum(iamrko, [])
except:
                pass
                logger.error("获取excel信息出错")
                sys.exit(1)

3,获取评论,图片,视频的主要代码

    def get_messagee(a,n,excel_cell_value_2,web_text_1):
        try:
            name = re.search(r'<span class="a-profile-name">(.*?)</span>', a)
            name = name.group(1)
            score =
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值