乱码出现的原因:
计算机是一个非常笨的机器,它只认识两个东西 0 1
在计算机中保存的任何内容,最终都需要转换为 0 1这种二进制编码来保存,包括网页中的内容
比如:中国 在计算机底层,可能需要转化为 10011100001010111(例子)
在读取内容时需要将二进制编码再转化为正确的内容
编码:依据一定的规则,将字符转化为二进制编码的过程
解码:依据一定的规则,将二进制编码转换为字符的过程
字符集:
编码和解码所采用的规则,我们称为字符集
常见的字符集: ASCII
ISO-8859-1
GBK
GB2312 中文系统的默认编码
UTF-8 万国码,支持地球上所有的文字
产生乱码的根本原因是,编码和解码采用的字符集不同
在中文系统的浏览器中,默认都是使用GB2312进行解码的
源码:
<!doctype html>
<html>
<head>
<!-- 需要来告诉浏览器,网页所采用的编码字符集
meta标签用来设置网页的一些元数据,比如网页的字符集,关键字,简介
meta是个自结束标签,编写一个自结束标签时,可以在开始标签中添加一个/
-->
<meta charset="utf-8" />
<title>网页的标题</title>
</head>
<body>
<h1>这是一个非常漂亮的网页</h1>
</body>
</html>