爬虫52讲
白呆呆
一只菜鸟
展开
-
3. 爬虫的基本原理
3. 原理探究,了解爬虫的基本原理 文章目录3. 原理探究,了解爬虫的基本原理3.1 爬虫概述3.2 获取网页3.3 提取信息3.4 保存数据3.5 抓取什么样的数据3. 6 JavaScript渲染页面 3.1 爬虫概述 简单地说,爬虫就是获取网页并提取保存信息的自动化程序 3.2 获取网页 获取网页的源代码,向网站的服务器发送一个请求,返回的响应体便是网页源代码 借助urllib、...转载 2020-03-02 18:13:29 · 163 阅读 · 0 评论 -
2. Web网页基础
2. Web网页基础 文章目录2. Web网页基础2.1 网页的基本组成2.1.1 HTML2.1.2 CSS2.1.3 JavaScript2.2 网页的结构2.3 节点树及节点间的关系2.4 选择器2.4.1 id选择节点——#2.4.2 class选择节点——.2.4.3 标签名选择节点2.4.4 CSS嵌套选择 2.1 网页的基本组成 网页可以分为三大部分:HTML、CSS 和 JavaS...原创 2020-02-29 17:02:16 · 314 阅读 · 0 评论 -
1.HTTP基本原理
1.必知必会,掌握HTTP基本原理 // 记录崔庆才老师的《52讲轻松搞定网络爬虫》学习笔记。 文章目录1.必知必会,掌握HTTP基本原理URI 和 URL超文本 HypertextHTTP 和 HTTPSHTTP 请求过程请求请求方法请求头其他请求头信息请求体响应响应状态码响应头★响应体 URI 和 URL URI的全称为 Uniform Resource Identifier,即统一资源标志符...原创 2020-02-29 16:38:29 · 370 阅读 · 0 评论