最近正在准备秋招,由于准备工作需要很多数据集做项目,就想自己从网上爬数据分析~ 所以开始了爬虫的学习之旅。开始学习,根本摸不着头脑,看书效率也不高,走了不少弯路,现在就把自己认为爬虫入门的教程或者说经验整理一下。以便以后自己回顾,也供大家参考~
1.Python基础准备
在学习爬虫之前,首先应该问自己python编程吼不吼啊? 语法会不会啊?不会的话先学python的基本语法,在此推荐一本入门书:python编程:从入门到实践这本书很通俗易懂,跟着课后题把程序敲一遍,入门很轻松~
2.Python爬虫入门(视频)
在别人说起列表,字典,函数,类等不会感觉一头雾水的时候,就可以开始学习爬虫,看书入门即使书上再怎么说爬虫很简单,自己也是摸不着头脑的。最好的爬虫入门是跟着视频敲一遍,在这里推荐慕课网上北理嵩天老师的:python网络爬虫与信息提取。老师讲课逻辑非常清晰,知识点讲得非常全,代码也很健壮!!!
python网络爬虫实战 网易学习课,老师是在jupyter notebook上写的代码,参考价值不高,但是老师分析网页元素,找到自己所需要爬取东西的过程非常值得学习。
拉勾网爬虫介绍了一些反爬,并克服反爬的技术~
Python爬虫三大案例实战分享老师讲话有点快,但是也都是干货
3.Python爬虫提高(书籍)
在看过很多案例视频之后,看书就会理解得比较快。到了这一阶段(时间比较赶),我看书只会针对性地看一些视频中自己比较模糊的部分。例如正则表达式和Scrapy框架。
4.写代码的时候,即使代码和老师的完全一样,也可能会报错。这时候不要不耐烦跳过,也不要慌张,弄懂报错的原因,有条理地去解决,会对学习更有帮助的。