Kemin | 本博客只发技术内容,更多在sugeladi.net/kemin

己欲立而立人,己欲达而达人。

关于编码的一些认识和理解(Kemin原创)

初步了解到在网页出现乱码的原因可能是,编码的显示的错位。这里要弄明白两个概念,就是文件的编码和文件的解码(即显示)。

  1. 文件的编码
    大家都知道每一个文本文件(html也是文本文件)都是使用一种编码字符集来保存的(各种的文本编辑器都提供了选择不同的编码方式来来保存文件)。这里有个很重要的就是到底现在有什么样的码给我们去编,请查看相关资料。
  2. 文件的解码
    鸡跟鸭讲肯定乱~,应用程序(如IE)按不对的解码方式来解开文件(如网页HTML)必然出现乱码。举个例子,如果网页是用UTF-8编码,而浏览器却用GB2132解码方式解就会出现乱码。就是说,大码编小码解会出现乱码,反之则可能可以(之所以,偶也没有将所有的字符集验证过),因为大字符集向后兼容。请查看相关资料。


这里又有一个问题,就是应用程序是怎么样决定是什么样的解码方式文读取数据文件的呢。偶是做BS方面的开发的,所以这里只谈与B有关的。经实践总结暂时知道有以下三种方法:

  1. 浏览器方式
    IE里的“查看-》编码-》……”,我想上过网的人都用过了。它就是上面所说的“应用程序决定什么样的解码方式”。浏览器提供了手动的功能。
  2. HTML方式

ISO陆续制定了一批适用于不同地区的扩充ASCII字符集
服务器编程方式
我是中国人123abcABC@@@

待绩……

阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/keminlau/article/details/386662
个人分类: 应用开发
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭