无论是从入门级选手到专业级选手都在做的爬虫,还是Web程序开发、桌面程序开发,又或者是科学计算、图像处理,Python编程都可以胜任。或许是因为这种属性,周围好多小伙伴都开始学习Python。Python爬虫可以自学吗,有哪些好的书籍推荐?
1、如果你用Python3写爬虫,强力推荐《Python网络数据采集》这本书,应该是目前最系统最完善介绍Python爬虫的书。可以去图灵社区买电子版。
书的内容很新也很系统,从beautifulSoup,requests到ajax,图像识别,单元测试。比起绝大多数blog零散的教程要好的多,看完书后就可以去做些实战项目,这个时候可以去github上找类似的项目借鉴下。
2、国内也有一本讲爬虫的好书,《自己动手写网络爬虫》,这本书除了介绍爬虫基本原理,包括优先级,宽度优先搜索,分布式爬虫,多线程,还有云计算,数据挖掘内容。只不过用了java来实现,但思路是相同的。
Python爬虫靠系统学习固然好,直接写一个项目出来效果更加简单粗暴!(不过自己现在的水平写出来都是流水一般的面向过程的代码,代码的重复部分太多,正在回过头去学习面向对象编程,学习类和方法的使用。不过,我还是坚定地认为:入门的时候,应该直接简单粗暴地实践一个项目。
3、哪里不会搜哪里!哪里报错改哪里!相信我你遇到的99%的问题都能从网上找到相似的问题,你需要做的就是写代码!搜问题!调BUG!你搜不到解决办法的情况下,80%的情况是你搜索的姿势不对,另外20%可能需要你自己动动脑子,换个思路去做。
目前在IT行业里,技术是在新月异的更新中,不断换代升级,Python行业更是如此。而我们知道,在学校所学专业知识可能很难满足如今的社会需求。
说了这么多,要是现在的情况不适合你进行自学,或许是你的自制力不够,或许是你没有足够多的时间自学,或许你需要更专业的课程学习,相信专业的课程学习能带给你更多东西,相信你会收获更多的友谊和人脉资源。