python爬虫基础——万维网WWW和http协议

最新推荐文章于 2024-06-07 23:06:52 发布

SupreEvi

最新推荐文章于 2024-06-07 23:06:52 发布

阅读量772

点赞数 2

分类专栏： Python学习心得文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SupreEvi/article/details/88240677

版权

pyhton爬虫基础

1.统一资源定位符URL

1.1 URL的格式

1.2 使用http的URL

2.超文本传送协议HTTP

2.1 HTTP的操作过程

2.2 HTTP的报文结构

3.超文本标记语言HTML

万维网

万维网是一个大规模的、联网式的信息储藏所，英文简称为Web。

万维网使用链接的方法能非常方便地从因特网上的一个站点访问另一个站点（也就是链接到另一个站点），从而主动地按需获取丰富的信息。

万维网是一个分布式的超媒体（hypermedia）系统，它是超文本（hypertext）系统的扩充。所谓超文本就是包含其他文档的链接的文本。也就是说，一个超文本由多个信息源连接而成，利用一个链接可以使用户找到其他文档，而这又可以连接到其他的文档。超文本就是万维网的基础。

万维网以客户-服务器方式工作。浏览器其实就相当于一个客户端，它可以向服务器发送访问请求。万维网文档所驻留的主机则运行服务器程序，因此这个主机也被称为万维网服务器。

客户程序（浏览器）向服务器程序发送请求，服务器程序向客户程序送回客户所要的万维网文档。

可以看出，万维网必须解决以下几个问题：

（1）怎样标志分布在整个因特网上的万维网文档？

（2）用什么样的协议来实现万维网上的各种链接？

（3）怎么样才能使不同作者创建不同风格的文档，并且可以在因特网上的各种主机上显示出来？

为了解决第一个问题，万维网使用统一资源定位符URL（Uniform Resource Locator）

最低0.47元/天解锁文章

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python爬虫基础——万维网WWW和http协议

pyhton爬虫基础万维网1.统一资源定位符URL1.1 URL的格式1.2 使用http的URL2.超文本传送协议HTTP2.1 HTTP的操作过程2.2 HTTP的报文结构3.超文本标记语言HTML万维网万维网是一个大规模的、联网式的信息储藏所，英文简称为Web。万维网使用链接的方法能非常方便地从因特网上的一个站点访问另一个站点（也就是链接到另...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。