背景
需求来源:跨境电商客户需要对指定商品的评论进行监控,该应用为上述场景的自动化实现
所属行业:电商
前置条件
暂无
亚马逊网址:Amazon.cn
操作流程
1. 第一步:循环模板表格中的商品链接,前往相应的商品详情页
2. 第二步:抓取页面上的文字元素
1)商品无评论
2)商品评论较少,无【查看全部xx条商品评论】按钮
3)商品评论较多,点击【查看全部xx条商品评论】进入评论页获取,并根据采集数量判断是否需要点击下一页
4)采集数量大于实际评论数量,下一页按钮置灰,直接退出循环
3. 第三步:下载评论图片/视频
若采集范围选中了下载评论图片或下载评论视频,且评论中含有图片或视频,则在指定文件夹中新建一个文件夹,命名为亚马逊商品评论附件,将图片或视频下载到该文件夹中,且将本地路径写入到结果文件的【评论图片/视频】列(命名可以自定义,如1.jpg,2.mp4,只要不重复就行)
4. 第四步:表格处理+网页关闭
将数据都写入结果文件后,处理表格样式
关闭打开的网页,运行完成后最小化浏览器窗口
3.结果展示
该RPA是通过自然机器人RPA产品软件完成,所属也是自然机器人。欢迎大家了解自然机器人。
主要代码:
1,获取excel文件
try:
pass
if param_value_1 != None and os.path.splitext(param_value_1)[1] not in [".xlsx", ".xls", ".xlsm", ".xlsm"]:
raise Exception('模板文件名不正确')
if not os.path.exists(os.path.dirname(param_value_1)):
raise Exception('模板文件所在目录不存在')
if os.path.exists(param_value_4) !=True:
raise Exception('文件夹路径不存在')
if hasattr(ntr.app, 'office'):
excel_obj_2 = ntr.app.office.excel.open(param_value_1, visible=True, readonly=False, password=r"",write_password=None, dispatch="auto")
else:
excel_obj_2 = ntr.app.microsoft.excel.open(param_value_1, visible=True, readonly=False, password=r"",write_password=None)
file_path_1 = param_value_1
except(SDKError,Exception) as e:
pass
error = '{0}'.format(e)
logger.error('Error-打开Excel-出现异常 ' + error)
Debug_Block_Error('Error-打开Excel-ooown9092t6z', error, True)
sys.exit(1)
2,获取excel文件信息
try:
sheet_obj_2 = excel_obj_2.get_sheet()
cell_row_cnt_1 = sheet_obj_2.row_count()
iamrko = sheet_obj_2.read(r"A" + str(2) + ":" + r"A" + str(cell_row_cnt_1))
iamrko = sum(iamrko, [])
except:
pass
logger.error("获取excel信息出错")
sys.exit(1)
3,获取评论,图片,视频的主要代码
def get_messagee(a,n,excel_cell_value_2,web_text_1):
try:
name = re.search(r'<span class="a-profile-name">(.*?)</span>', a)
name = name.group(1)
score =