字符编码原理
字符:是一个一个肉眼可见的“形状/符号”。
字符编码:在计算机内部,每个字符都用一个“唯一对应的数字”来代表该字符。
在中国:
中: 5000 (假设)
国: 5001 (假设)
在日本:
田:15000 (假设)
中:15001 (假设)
N:5000 (假设)
中国人用中文软件写邮件,内容为: 中国人很有钱。。。。
该邮件发给日本人的一个日文读邮件的软件,则看到的是:N#¥%#!
在中国,有几套字符编码标准:gb2312(大约6000汉字), gbk(大约含2万多汉字,其中完全包括了gb2312的所有汉字),
有一个国际组织制定一个能够兼容全球几乎“所有”语言的一个字符编码标准,就称为“utf-8”
可以稍微记一下:A编码是65,a编码是97
网页上的乱码原理:
1, 文件的实际编码:一个网页就是一个文件,每个文件在创建(保存)的时候,都由其编辑器(记事本,或editplus等)来决定该文件的编码。
2, 网页的声明编码:head标签中中的一行代码:
<meta http-equiv="Content-Type"content="text/html;charset=编码名称"/>
编码名称:gb2312,gbk,utf-8
文档——文件编码——更改文件编码方式,中更改编码方式使其与head标签中编码方式相同
若不声明则直接把该语句删除,这是一种不良做法,不建议采用