HTML文件中文乱码

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xiaoxiezZ/article/details/78356316

HTML出现乱码的原因很多,与编辑器和浏览器等都有关系,出现乱码首先要找到问题所在。

1. 常见编码:

(1)utf-8:(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到4个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言(如日文,韩文)。“万国码”顾名思义可以支持很富哦语言,包括阿拉伯文等。

(2)gb2312: 信息交换用汉字编码字符集。 《信息交换用汉字编码字符集》是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980。 GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。 一般简体中文的网站使用GB2312比较多。

总的来说utf-8支持的语言种类要比gb2312多,简体中文网站可以使用gb2312。

2. 编辑器:

(1)最基础的编辑器是记事本,在编写好文件存储为html文件时除了文件内部所用的编码方式,还要注意保存时的编码方式(小细节容易被遗漏)。


2. 数据库的处理:

如果网页设置的编码是gbk,但是数据库的却是utf-8的,写数据库连接文件的时候要注意。

如写数据库连接文件时写成:

mysqp_query("SET NAMES'GBK'");
那页面也要相应的变成:
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />

阅读更多

没有更多推荐了,返回首页