java字符编码

原创 2015年07月08日 21:33:38

1.字符集   与  字符集编码

字符集是指待表示的字符集合。GB 2312是一个中文字符集,收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。每个字符用两个字节表示。big5为台湾繁体字符集.....,相同的字节在不同的字符集中表示不同的字符。为了统一,提出unicode字符集。

unicode它为每种语言中的每个字符设定了统一并且唯一的二进制编码。每个字符集(不论是gb2312,big5,gbk,unicode)中,每个字符都是由一个固定长度的二进制数表示,如unicode字符集中,汉字的'汉',用0x6C49表示。为了表示汉字的‘汉’,可以在存储介质上以0x6c49表示。对于大多数字符集而言,字符集和字符集编码是一致的。但是,unicode表示了每种语言的字符,英文字符原来是ASCII字符集,当采用unicode,意味着英文字符在存储介质上占用的空间翻倍,而且和原来的表示不兼容。从而提出了字符集编码的方式来解决该问题。字母A在unicode字符集中,以0x0065表示,在保存在存储介质时,只存储0x65。这就是utf-8的编码,以变长字节表示。

2.jvm内部采用unicode字符集,采用utf-16编码

相关文章推荐

JAVA_字符编码

  • 2012年08月16日 11:43
  • 51KB
  • 下载

JAVA字符编码问题总结

  • 2013年06月20日 14:39
  • 25KB
  • 下载

Java中字符编码问题和中文占几个字节的问题(ASCII Unicode UTF-8 )

ASCII码在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节...

JAVA中文字符编码问题详解.doc

  • 2010年09月16日 23:15
  • 142KB
  • 下载

java字符编码错误整理大全

  • 2012年10月11日 00:24
  • 6KB
  • 下载

黑马程序员--------java IO流 File类、Properties、打印流、合并流、对象序列化、随机读写、字符编码

-----------android培训、java培训、java学习型技术博客、期待与您交流!------------ File类   1、用来将文件或者文件夹封装成对象, 方便对文件与文件夹...

java字符编码问题

  • 2008年04月18日 17:27
  • 3KB
  • 下载

java字符编码转换研究(转)

1. 概述 本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。 在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:java字符编码
举报原因:
原因补充:

(最多只允许输入30个字)