- 博客(5)
- 收藏
- 关注
原创 【爬虫学习】⑤ 多线程/多进程基本原理#
学习网站 https://www.bilibili.com/video/BV1RM4y1u7Bj?p=4&spm_id_from=pageDriver 此系列是在学习 “python3网络爬虫开发实战从入门到精通 北航硕士崔庆才经典52讲” 所做的笔记 带#为重点内容 多线程的含义 进程 能同时做到运行这么多任务是因为 任务对应着线程的执行。进程是线程的集合,是由一个或多个线程构成的。线程是操作系统进行运算调度的最小单位,是进程中的一个最小运行单元。 多线程 多线程就是一个进程中同时执行多个线程
2021-07-09 00:27:47
105
原创 【爬虫学习】④ Session 与 Cookies
学习网站 https://www.bilibili.com/video/BV1RM4y1u7Bj?p=4&spm_id_from=pageDriver 此系列是在学习 “python3网络爬虫开发实战从入门到精通 北航硕士崔庆才经典52讲” 所做的笔记 静态网页和动态网页 静态网页 由 HTML 代码编写 文字、图片等内容均通过写好的 HTML 代码来指定 加载速度快,编写简单 存在很大缺陷,如可维护性差,不能根据 URL 灵活多变地显示内容等 动态网页 可以动态解析 URL 中参数的变化 关
2021-07-08 09:46:12
70
原创 【爬虫学习】③ 爬虫的基本原理
学习网站 https://www.bilibili.com/video/BV1RM4y1u7Bj?p=4&spm_id_from=pageDriver 此系列是在学习 “python3网络爬虫开发实战从入门到精通 北航硕士崔庆才经典52讲” 所做的笔记 爬虫 爬虫就是获取网页并提取或保存信息的自动化程序 步骤 获取网页 提取信息 保存数据 自动化程序 能抓怎样的数据 JavaScript渲染页面 ...
2021-07-07 14:53:00
51
原创 【爬虫学习】② Web网页基础
网页的组成 HTML CSS JavaScript 例子 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>This is a Demo</title> </head> <body> <div id="container"> <div class="wrapper"> <h2 class="title"
2021-07-07 11:36:40
43
原创 【爬虫学习】① HTTP基本原理
统一资源UR* URI(Uniform Resource Identifier)即统一资源标志符 URL (Universal Resource Locator) 即统一资源定位符 URN(Universal Resource Name)即统一资源名称 例如: https://github.com/favicon.ico 既是一个URL,也是一个URI 即有这样的一个图标资源 用URL/URI来唯一指定了它的访问方式 这其中包括了访问协议HTTPS、访问路径(即根目录)和资源名称favicon.i
2021-07-07 10:42:19
59
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人