爬虫
文章平均质量分 93
@See you later
道阻且长,行则将至
展开
-
浅学 ------ 爬虫(二)
文章目录网页基础HTML 基本语法元素由三大部分组成:元素的属性空元素元素的嵌套序列HTML 文档结构网页基础HTML 基本语法 HTML 全称 Hyper Text Markup Language,翻译过来是 超文本标记语言,是计算机语言的一种,由 元素 构成,用来结构化 Web 网页及其内容。元素由三大部分组成: 1、开始标签:一对尖括号(即键盘上的小于号 < 和大于号 >)中间包裹着元素名称; 2、元素内容:页面中用户可以看到的内容; 3、结束标签:与开始标签类似,原创 2022-05-04 14:28:46 · 382 阅读 · 0 评论 -
浅学 ------ 爬虫(一)
文章目录初始爬虫爬虫的工作原理爬虫的三个步骤:requests库PyCharm安装requestsrequests.get() 方法res.status_coderes.textres.contentres.encoding初始爬虫爬虫的工作原理 爬虫可以像浏览器一样向服务器发起请求,拿到服务器返回的数据后,可以根据我们设定的规则去提取需要的数据,数据处理完成后再将数据存储起来。 相当于浏览器爬虫的三个步骤:1、获取数据2、处理数据3、存储数据第一步:获取数据,爬虫会根据我们提供的原创 2022-05-04 09:36:48 · 1054 阅读 · 0 评论