关于字符编码

转载 2018年04月14日 22:27:46
ansi  <127  单字节,半角
GB2312 是对 ASCII 的中文扩展。 双字节,全角 >127,127-255
gbk  GBK包括了GB2312 的所有内容,同时又增加了近20000个新的汉字(包括繁体字)和符号。 >127,随便
gb18030  又加了几千个字
统称“DBCS“(Double Byte Charecter Set 双字节字符集
Unicode   废了所有的地区性编码方案,重新搞一个包括了地球上所有文化、所有字母和符号 的编码!“字节”是一个8位的物理存贮单元,而“字符”则是一个文化相关的符号。在unicode中,一个字符就是两个字节。从unicode开始,无论是半角的英文字母,还是全角的汉字,它们都是统一的”一个字符“
UTF-8就是每次8个位传输数据,而UTF-16就是每次16个位。UTF-8就是在互联网上使用最广的一种unicode的实现方式,unicode一个中文字符占2个字节,而UTF-8一个中文字符占3个字节

最后简单总结一下:

  • 中国人民通过对 ASCII 编码的中文扩充改造,产生了 GB2312 编码,可以表示6000多个常用汉字。
  • 汉字实在是太多了,包括繁体和各种字符,于是产生了 GBK 编码,它包括了 GB2312 中的编码,同时扩充了很多。
  • 中国是个多民族国家,各个民族几乎都有自己独立的语言系统,为了表示那些字符,继续把 GBK 编码扩充为 GB18030 编码。
  • 每个国家都像中国一样,把自己的语言编码,于是出现了各种各样的编码,如果你不安装相应的编码,就无法解释相应编码想表达的内容。
  • 终于,有个叫 ISO 的组织看不下去了。他们一起创造了一种编码 UNICODE ,这种编码非常大,大到可以容纳世界上任何一个文字和标志。所以只要电脑上有 UNICODE 这种编码系统,无论是全球哪种文字,只需要保存文件的时候,保存成 UNICODE 编码就可以被其他电脑正常解释。
  • UNICODE 在网络传输中,出现了两个标准 UTF-8 和 UTF-16,分别每次传输 8个位和 16个位。于是就会有人产生疑问,UTF-8 既然能保存那么多文字、符号,为什么国内还有这么多使用 GBK 等编码的人?因为 UTF-8 等编码体积比较大,占电脑空间比较多,如果面向的使用人群绝大部分都是中国人,用 GBK 等编码也可以。

来自:https://www.zhihu.com/question/23374078  

http://www.qianxingzhem.com/post-1499.html

更多:https://wenku.baidu.com/view/cbb11a176edb6f1aff001f8d.html?sxts=1523715864119



java web开发中的字符编码问题。

         昨天在论坛里发了一个帖子,就自己在开发中遇到的一个问题向人求助。有很多热心的网友给出了建议,而且确确实实的解决了这个问题。 我想很多新手可能都会遇到这样的问题,所以,我把这个问题在这...
  • yutan_313
  • yutan_313
  • 2007-09-06 10:14:00
  • 747

关于 字符编码的 转换 知识

  • 2014年10月04日 21:43
  • 510KB
  • 下载

Unicode、UTF-8、UTF-16字符编码的那点事

相信不少人被字符乱码的问题给困扰过。字符编码,确实是一个碍手的事。在这里写一下这三种编码的那点事。  首先看一下下面的程序        System.out.println("a(Unicode) ...
  • mupenghaha
  • mupenghaha
  • 2013-04-22 18:40:48
  • 390

关于字符集和Unicode的相关知识

每个程序员都绝对必须知道的关于字符集和Unicode的那点儿事(别找借口!) Unicode与字符集 你曾经是否觉得HTML中的"Content-Type"标签充满神秘?虽然你知道这个东西...
  • youoran
  • youoran
  • 2012-12-15 19:20:59
  • 2142

关于JSP/Servlet字符编码

首先,来说一下HTML和JSP的区别: HTML属于前台,纯展示页面,请求HTML时,容器(如Tomcat)会读取HTML文件的内容,通过socket遵循HTTP协议发送到浏览器; JSP属于后台,请...
  • xuefeng0707
  • xuefeng0707
  • 2014-04-06 00:56:21
  • 4578

关于字符编解码

关于字符编解码的内容,阮一峰大神的这篇文章已经讲得很清楚了: http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html ...
  • nirendao
  • nirendao
  • 2017-04-17 16:43:14
  • 459

Java IO _字符编码

1.了解常用的几种编码 2.掌握乱码的产生原因 如果没有处理好编码的事情,则肯定在程序中出现乱码。 System 类可以取得系统的相关信息,一直在接触此类。 publi...
  • hanshileiai
  • hanshileiai
  • 2011-08-25 21:10:00
  • 2964

字符 编码 概述

  • 2009年07月24日 17:45
  • 41KB
  • 下载

HTML特殊字符编码

  • 2008年11月11日 09:17
  • 114KB
  • 下载

关于JAVA字符编码:Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换

  • 2011年07月29日 23:02
  • 9KB
  • 下载
收藏助手
不良信息举报
您举报文章:关于字符编码
举报原因:
原因补充:

(最多只允许输入30个字)