有朋友在群里和大家讨论,问的最多的问题就是,python 爬虫学到什么程度可以去找工作了,关于这点,和大家分享下我的理解。
确立目标、了解需求
首先我们要先定位自己的目标,当然我们先以爬虫工程师来做个说明。
去招聘网上看看需求都有哪些,直接做个拉勾网爬虫(有需要的私信)出结果了:
仔细看看,我们可以得出以下几点:
1、 python 不是唯一可以做爬虫的,很多语言都可以,尤其是 java,同时掌握它们和拥有相关开发经验是很重要的加分项
2、 大部分的公司都要求爬虫技术有一定的深度和广度,深度就是类似反反爬、加密破解、验证登录等等技术;广度就是分布式、云计算等等,这都是加分项
3、 爬虫,不是抓取到数据就完事了,如果有数据抽取、清洗、消重