HTML与URL的简单理解


URL和HTML的关系

感觉先了解一下两者的关系能更好理解URL与HTML

  • URL不严谨的讲就是网站,HTML是网页内容。
  • 在浏览器输入URL(网站),浏览器会向HTTP服务器发送Request请求,HTTP服务器把Response文件对象(网页内容)发送给浏览器,浏览器将网页内容都下载完成后你就会在浏览器看见网页。

URL

Uniform Resource Locator,即统一资源定位符。
通俗的讲就是网站,具体如下图
URL
?及之后的字符为URL的参数,比如?id=123&name=xiaoming,爬取时不包含在requests的URL中,而在params中。

HTML

  • HyperText Markup Language(超文本编辑语言),比单纯的文本功能更多
  • 不是编程语言,是描述网页的语言
  • 告诉浏览器如何构造网页,由HTTP服务器发给浏览器

具体组成如下图所示
HTML
<!DOCTYPE>是文档类型声明,告诉浏览器使用的是那种HTML版本显示网页,<!DOCTYPE html>告诉浏览器当前页面采取的是HTML5版本来显示网页。

HTML就像一个大盒子,盒子一个套一个,盒子里面有一定的信息,爬虫就像从盒子里面取东西,有些盒子里面还会有URL,就可以进一步爬到其他网页。

每个盒子的组成如下图所示
盒子
下面讲一下盒子的tagtag就像是盒子的类型,每个类型的盒子只能装属于他自己的东西。具体如图所示
tag
想要具体了解更多tag的类型可以去下面这个URL
tag类型查找

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

0h_h0

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值