刚刚过去的 2019 年,是数字化转型进程中极为重要的一年。企业纷纷开始走上转型之路,各种技术的应用案例层出不穷,RPA 无疑是这波变革浪潮中的闪耀之星。随着越来越多的企业关注到 RPA,一些疑问也随之产生。
有些人会直接问我们,RPA 和爬虫有什么区别。
大家把 RPA 和爬虫联系在一起也不奇怪。当RPA被用来展示功能的时候,方便起见,通常就是设定一个 RPA 采集某个网站特定信息的自动化工作流程,生成一个表单,用以演示资料整理工作自动化的迅速高效。这项工作和爬虫的应用看起来很像,但原理完全不同,只不过是 RPA 应用的冰山一角罢了。
如果要回答 RPA 和爬虫有什么区别,简单说就是“天差地别”。接下来,我们来详细介绍一下他们的差异点。
定义
RPA全称 Robotic Process Automation,即机器流程自动化,通过模仿人的方式在电脑上执行一系列操作,可以实现人在电脑上的所有操作行为,如复制、粘贴、数据录入、网页导航、打开、关闭等,并且可以按照一定的规则持续不断的重复操作。
爬虫的官方名字叫数据采集,一般称作 spider,通过编程的方式实现,能够全自动的从互联网上采集数据。抓取数据的速度有时非常庞大,甚至可以达到几千万上亿的数据量。
使用技术
RPA属于 AI 人工智能的范畴,通过设计流程来规定 RPA 模拟人的动作执行任务。
爬虫使用 Python 开发脚本,通过发送 http 请求获取 cook