因工作需要,首次接触Python和爬虫,将会参考很多书籍及网络资料(网络资料以搜索到的为准,并未对第一作者进行考证),这里进行一个整理,并记录下学习历程~
一、软件下载及环境配置
1、anaconda
- 用于科学计算的Python发行版,提供了包管理与环境管理`的功能,可以很方便地解决多版本python并存、切换以及各种第三方包安装 问题,并且已经包含了Python和相关的配套工具 。(参考下述 配置及教程 中的说法 )
- 下载地址
- 配置及教程 (Anaconda使用总结,讲解地很细致,也很实用 )
2、fiddler
- http协议调试代理工具
- 直接百度下载就行,具体使用见下面网络资料系列
二、网络资料系列
把网络资料放在前面,是因为我自身还比较浮躁,中规中矩看书学习容易分神。而看网络教程能有很明显的进展,进而有个比较大体的认知。当然,兴趣提上来以后,再补基础跟理论就有趣多了。
- 零基础自学用python 3开发网络爬虫系列
这四篇是网上搜到的一个作者的学习经验,很适合零基础学习的人看。不过就只有四篇,没有再继续了。
-
【HTTP】Fiddler系列
三、书籍资料
接到任务当天是打算买本或者借本书看的,但并不知道选什么书好。深圳的福田区图书馆有个“选书帮”活动,可以在书城扫新书直接借走,下班后便去逛了逛,刚好看到这本书。
才刚开始看,如果不错的话之后会针对本书具体写一写。
《用Python写网络爬虫》 —— [澳]Richard Lawson 著(李斌 译)
现在Python语法现在还不熟,只是参考例子编写了简单的程序,稍微熟悉了下用法。第一篇就先写这么多啦。
ps:顺便熟悉了下Markdown语法