网页乱码,记事本编译乱码报错,导入项目工程注释乱码,这都是我们经常遇到的乱码,今天来探讨一下乱码出现的原因
计算机只能识别0和1,所在保存内容时,要先转化成二进制格式的文件.在读取时又将二进制文件转化成我们所保存的内容.
在这个过程中,涉及到两个概念
编码:依据一定的规则,将字符转换为二进制编码的过程
解码:依据一定的规则,将二进制编码转换为字符的过程.
解码和编码所采用的的规则,就是我们通常所说的字符集,常见的字符集有:
- ASCII
- ISO-8859-1
- GBK 国标码
- GB2312 中文系统的默认编码
- UTF-8 万国码,支持地球上所有的文字
- ANSI 自动以系统的默认编码来保存文件
到这里,产生乱码的原因就已经一目了然了:编码和解码的采用的字符集不同,导致乱码的出现
再有一个小知识点,中文浏览器默认的编码格式都是GB2312
网页乱码问题的解决方法:
在head标签中添加meta标签
<head>
<meta charset="utf-8" />
</head>