网页上的乱码原理

字符编码原理

字符:是一个一个肉眼可见的“形状/符号”。

字符编码:在计算机内部,每个字符都用一个“唯一对应的数字”来代表该字符。

在中国:

中: 5000       (假设)

国: 5001   (假设)

 

在日本:

田:15000       (假设)

中:15001       (假设)

N5000   (假设)

中国人用中文软件写邮件,内容为: 中国人很有钱。。。。

该邮件发给日本人的一个日文读邮件的软件,则看到的是:N#¥%#!

 

在中国,有几套字符编码标准:gb2312(大约6000汉字), gbk(大约含2万多汉字,其中完全包括了gb2312的所有汉字),

 

有一个国际组织制定一个能够兼容全球几乎“所有”语言的一个字符编码标准,就称为utf-8

可以稍微记一下:A编码是65a编码是97


网页上的乱码原理:

 

1,  文件的实际编码:一个网页就是一个文件,每个文件在创建(保存)的时候,都由其编辑器(记事本,或editplus等)来决定该文件的编码。

2,  网页的声明编码:head标签中中的一行代码:
<meta http-equiv="Content-Type"content="text/html;charset=编码名称"/>

编码名称:gb2312gbkutf-8

文档——文件编码——更改文件编码方式,中更改编码方式使其与head标签中编码方式相同

 

若不声明则直接把该语句删除,这是一种不良做法,不建议采用

 

展开阅读全文

没有更多推荐了,返回首页