python网络爬虫学习1

taojianglong

于 2020-02-04 13:25:52 发布

阅读量111

点赞数

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38915710/article/details/104168437

版权

一、网络爬虫理解

网络爬虫，又名网络蜘蛛，即通过网络蜘蛛来获取有关网页的内容。

网络爬虫是从某一个网站开始，读取网页的内容，如果网页中有其他网页的链接地址，则顺着这些地址继续读取网页内容，直至该网站所有网页内容都被读取完为止。

二、网页浏览过程

浏览器通过DNS服务器查找域名对应的ip地址；

向ip地址对应的web服务器发送请求；

web服务器响应请求，发回html页面；

浏览器解析html内容，并显示出来。

三、url解释

url由三部分组成：

1.第一部分是协议。

2.第二部分是存有该资源的主机ip地址。

3.第三部分是主机资源的具体地址，如目录和文件名等。

例：protocol :// hostname[:port] / path / [;parameters][?query]#fragment

其中第一部分和第二部分用 "://" 隔开；

第二部分和第三部分用 "/" 隔开。（第一部分和第二部分是必不可少的，第三部分可以没有）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python网络爬虫学习1

一、网络爬虫理解网络爬虫，又名网络蜘蛛，即通过网络蜘蛛来获取有关网页的内容。网络爬虫是从某一个网站开始，读取网页的内容，如果网页中有其他网页的链接地址，则顺着这些地址继续读取网页内容，直至该网站所有网页内容都被读取完为止。二、网页浏览过程浏览器通过DNS服务器查找域名对应的ip地址；向ip地址对应的web服务器发送请求；web服务器响应请求，发回html页面；浏览器解析...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。