引子:
大家好,我是你们的社长,你们可以叫我老沈。我平时没空,如果有编程上的问题可以私信我,(某人不要问我数学)今天,我们讲一下爬虫。再结合一下,上节课我们学的函数式编程。
##########################################################################
第一节爬虫,我们先围绕爬虫的概念,基础,和爬取百度首页源代码来一点点一点点来学。
首先,我们看一下爬虫的概念,爬虫是......(我们直接看度娘的操作)
我们已经简单的理解了爬虫是什么。那么下面,我们就正式开始编写......
我们先写一个简单的——爬取百度网页源代码。
import requests
url = "http://www.baidu.com"
resp = requests.get(url)
print(resp.text)
我们怎么来理解这一段呢?
很简单,下面我们来解读一下:
import requests # 导入requests库,用来发送请求
url = "http://www.baidu.com" # 建立变量url
resp = requests.get(url) # 发送get请求,并存入resp变量
print(resp.text) # 打印resp变量的文本
这就是一个简单的爬取百度首页源代码的代码。
下周,我们再来继续学习爬虫,谢谢大家的捧场,掰掰~