HTML文档(网页)解析

HTML文档描述网页,也被称为网页,包括HTML标签和纯文本。
基本结构

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>Document</title>
</head>
<body>

</body>
</html>

结构解释

  • <!DOCTYPE html>
    这一行不是标签,是HTML的文档声明,告诉浏览器文件的类型,让浏览器解析器知道按哪个规范来解析文档。此处是HTML5的声明。
  • <html lang="en"></html>
    html根标记,lang="en"即默认解析文档的语言为英语(lang-Language、en-English)。
  • <meta charset="UTF-8">
    <meta>标签提供关于HTML文档的元数据,元数据不会显示在网页上。
    <meta charset="UTF-8">定义了文档使用的字符集(charset)为UTF-8,如需正确地显示 HTML 页面,浏览器必须知道使用何种字符集。
    常见的字符集
    1.ASCII(American Standard Code for Information Interchange,美国信息互换标准编码):万维网早期使用的字符集,支持0-9的数字,大写和小写英文字母表,以及一些特殊字符。
    2.GB2312:中国国家标准简体中文字符集。
    3.GBK:汉字内码扩展规范,包含全部中文字符、繁体。
    4.UTF-8是针对Unicode的一种可变长度字符编码,又称万国码。可以显示中文简体繁体及其它语言(如英文、日文、韩文),是电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。
  • <title></title>
    网站的标题写在此标签内
  • <body></body>
    用于向用户展示的内容写在此标签内
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值