哈喽,大家好,我是小爬虫,上一节我们讲了爬虫的基本介绍和学习路线,那么从今天开始我们正式进入学习。今天我们讲讲Python基础语法,这是学习爬虫的基础,因为后面学习的爬虫程序都是Python语言来写的。

学习地址
关于Python语法,如果你对Python已经比较熟悉了,那可以直接跳过这一篇文章,如果你不是很熟悉,这里我推荐一个学习的网站:
菜鸟教程 Python 3教程
这个网站将Python知识整理地非常全面。如果你有其他编程语言基础,如C语言、C++或Java等,那么基本将这个网站过一下,将其中的demo代码练一练就可以了。如果你没有其他语言基础,那么你需要认真花一点时间将这个网站每一节都仔细去学习一下,并且将其中每个demo都练习一下。
重点学习知识
下面我们指出接下来我们这个系列文章所重点用到的Python基础知识点,这些也是大家在学习基础时一定要掌握的地方,否则后面学习的时候寸步难行。
字符串处理
我们后面在做爬虫的时候会遇到各种各样的字符串处理的地方,比如字符串截取、拼接、格式化等等。其实不管任何编程语言,字符串处理永远都是一个非常重要的知识点,因为字符串是我们最直观能看到的东西,任何地方都有需要处理字符串的需求。关于字符串处理,可以重点看这个页面的内容:
字符串处理
列表、字典
和字符串一样,列表和字典的处理也是任何语言的一个重点,因为我们在后面写爬虫程序的时候,会经常碰到列表。列表就类似于其他语言里面的数组,字典类似于其他语言里面的Map,学过编程的都知道这两个容器有多重要,因此列表和字典也是一个我们需要重点学习的知识,这里可以参考:
列表
字典
条件控制、循环控制
条件控制和循环控制,是一个程序逻辑的主要控制线,和人的逻辑一样,这两个控制语句就是程序的逻辑控制器。学习这两个控制语句可以直接参考:
条件控制
循环控制
函数
函数能提高应用的模块性,和代码的重复利用率,也是一个程序的重要组成部分。函数写好了,你的程序逻辑就会非常清楚,还方便别人阅读。关于函数,主要学习如何定义一个函数,如何给函数传参,以及如何调用,学习函数可以参考:
函数
文件处理
我们在后续的爬取过程中,经常需要将爬到的数据存储到文件中,以及会从文件中读取出内容进一步处理,因此文件的处理也是非常重要的。我们主要需要学习如何打开一个文件,以什么模式(只读模式、读写模式等等)去打开,以及如何读取文件内容,如何向文件写内容等等。关于文件的学习,可以参考:
文件处理
以上列举了一些重点学习模块,当然除了这些还有很多其他的模块也需要掌握,比如xml、json的解析,多线程、协程的使用等等,大家都可以从这个网站自行去学习,或者从网上自行去查找其他资料进行学习,因为网上好的学习资料很多,这里就不重复写作了。
今天的内容就到这里,打好基础后,接下来我们就要准备正式开始写爬虫了,敬请期待。记得关注小爬哦~
本文首发于公众号:小爬虫,欢迎关注

本文介绍了Python基础语法学习的重要性,特别是对于爬虫初学者。推荐了菜鸟教程的Python3教程作为学习资源,强调了字符串处理、列表和字典操作、条件控制、循环控制、函数以及文件处理等核心知识点。建议读者根据自身编程基础选择相应学习路径,并为后续爬虫编程做好准备。
1313

被折叠的 条评论
为什么被折叠?



