第1课:什么是爬虫?什么是Python ?

本文介绍了什么是网络爬虫,通过比喻解释了爬虫的工作原理,并探讨了Python作为爬虫开发语言的原因。接着,简单概述了Python的历史和发展,强调其在编程领域的广泛应用。文章适合初学者,旨在帮助读者理解Python的基础和爬虫的基本概念,为后续的爬虫学习奠定基础。
摘要由CSDN通过智能技术生成

本课程学习目录-小白新手必看【其实大致看下就行】

了解什么是爬虫:

用专业术语讲出来就是
网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

通俗易懂的话理解:
其实就是好像,你在房间找某个东西,房间 就是所谓的 网站 万维网等等。而你代表的就是爬虫。你要找的某个东西,就是你要抓取的数据。而你要如何更快的找这个到东西,就需要通过大脑不断地回忆,进行排除,去缩小这个东西可能在的范围,达到准确位置,找到你的东西。 红色字体描述的这个过程,在网络中就是我们用编程语言写一些代码程序来抓取我们要的数据。

而写这个程序用的语言 可以是 很多种,一般都用 python 和 java 都可以写。这里我们要讲的就是 Python ,那么python 是什么呢?往下看

什么是python:

专业术语讲就是:
Python是一种跨平台的计算机程序设计语言。 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。

通俗易懂的话理解 :
你需要计算机为你做事情,就需要你和计算机交流说话,就要说 计算机听的懂的语言。就好像你要和 外国人说话,交流沟通,那你肯定要说的是英语等其他国家语言,外国人才听得懂。你说中文,那外国人肯定听不懂。所以你要学习计算机能懂的语言,也就是说的学编程。

如何理解编程:
市面上有很多编程语言 ,都有自己特点。比如要跟韩国人要说去做一件事,就需要用韩语去表达做一件事情 ,跟 法国人要说法国话 ,跟美国人要说 英语等等。现在市面上的编程语言也是一样,你要实现什么功能,就要给计算机说什么话。现在市面有 什么PHP ,C 语言系列,java , 等等一些语言。每个语言都有自己擅长的事情,但也有共同的可以做的事情。

就比如:美国人身材高大,你可以用英语叫他们去利用自己身材高大而做的事情。比如韩国人,叫什么欧巴,大长腿等等,那就可以用韩语去叫韩国人利用自己腿长的优势去做事情。那他们都有共同的都能做事情,比如吃饭,睡觉等等。

而让计算机去做某个事情,就需要你写代码程序,就好像在word写了一个教程。比如 《如何把买来的水果和菜放入冰箱》 这么一个教程。

比如是让韩国人在做这件事,那就用韩国人看的懂得韩语写,告诉韩国人如何把买来的水果和菜放入冰箱,当韩国人看到你的教程的时候,就会按照上面的教程一步一步放,最终把那些东西全部放入冰箱。这就是语言,就是计算机语言,也叫编程语言。

在未来写代码程序过程中,我们会遇到 两个专业术语:面对过程编程 面对对象编程 ,这两种编程方法。

面对过程编程: 就好像上面韩国人,会把水果,菜 一个一个放进冰箱

优点: 一步一步放水果,不用动脑子。
缺点: 每次放都需要看一遍教程。

面对对象编程: 我需要提前做好一个,冰箱里面放满水果和菜的模版图。然后韩国人,查看模版图,把菜和水果一下子放入冰箱。

优点: 不管你是什么冰箱,按照一个模版图就能一下子抱起来,把水果和菜放好。
缺点: 我每次放之前,都需要去看一遍模版图,比较费脑子。

下方是专业术语解释 面对对象编程 和面对过程编程的 优缺点【看不懂,就看上面就行】:

面向过程:

面向过程是一种自上到向下的编程。
优点:性能比面向对象高,因为面对对象编程的类调用时需要实例化,开销比较大,比较消耗资源,而面对过程编程就不需要实例化,比如单片机、嵌入式开发、Linux/Unix等一般采用面向过程开发,性能是最重要的因素。
缺点:没有面向对象易维护、易复用、易扩展。

面向对象:

面向对象是将事物高度抽象化。面向对象必须先建立抽象模型,之后直接使用模型就行了。

优点:易维护、易复用、易扩展,由于面向对象有封装、继承、多态性的特性,可以设计出低耦合的系统,使系统
更加灵活、更加易于维护。面向对象技术具有程序结构清晰,自动生成程序框架,实现简单,可有效地减少程序的维护工作量,代码重用率高,软件开发效率高等优点。
缺点:因为类调用时需要实例化,开销比较大,比较消耗资源,性能比面向过程低。

这时候肯定有人会问?什么是对象呢?

对象的概念: 对象是系统中用来描述客观事物的一个实体,它是构成系统的一个基本单位。

也就是上面一样说的,一个 装满水果和菜的冰箱,这样一个整体,叫 对象 。其中 有 水果类 也就是 class , 水果分为 橘子类 ,葡萄类 等等,而一个橘子可以理解为 一个函数 也就是 def ,里面包括的 橘子肉,橘子皮,橘子籽 这些就是我们说的 功能,把这些弄在一起就是一个橘子,弄在一起这个过程就叫做 封装 。

用 python 语言中, 万物皆 对象。 一个橘子也可以成为对象,而 橘子皮 ,橘子籽,橘子肉,也可以成为 类 。

Python发展历程:

1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,作为ABC 语言的一种继承。之所以选中Python(大蟒蛇的意思)作为该编程语言的名字,是取自英国20世纪70年代首播的电视喜剧《蒙提.派森的飞行马戏团》(Monty Python’s Flying Circus)。
ABC是由Guido参加设计的一种教学语言。就Guido本人看来,ABC 这种语言非常优美和强大,是专门为非专业程序员设计的。但是ABC语言并没有成功,究其原因,Guido 认为是其非开放造成的。Guido 决心在Python 中避免这一错误。同时,他还想实现在ABC 中闪现过但未曾实现的东西。
就这样,Python在Guido手中诞生了。可以说,Python是从ABC发展起来,主要受到了Modula-3(另一种相当优美且强大的语言,为小型团体所设计的)的影响。并且结合了Unix shell和C的习惯。
Python [5] 已经成为最受欢迎的程序设计语言之一。自从2004年以后,python的使用率呈线性增长。Python 2于2000年10月16日发布,稳定版本是Python 2.7。Python 3于2008年12月3日发布,不完全兼容Python 2。 [4] 2011年1月,它被TIOBE编程语言排行榜评为2010年度语言。

应用领域

Web 和 Internet开发
科学计算和统计
人工智能
桌面界面开发
软件开发
后端开发
网络爬虫

总结:当了解 Python 和编程 后,我们就要真正的进入学习啦,在这过程中,我不会把所有的基础都讲一遍,但是我会把 所要遇到的的一些,都会很基础很小白的讲一遍。让小白跟着做也能爬网站数据。

本课作业【一定要做哦】:

1.请举出一个 对象的 生活案列来描述 什么对象:【在下方留言评论即可,我会及时回复】

评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

宋哈哈呀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值