java 获得系统字符集_Java - 获取系统字符集编码

名词解释

ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)

基于常用英文字符

计算机处理时都是以二进制码的形式出现

这种二进制码的集合就是ASCII码

每个ASCII码与一个8位(bit)二进制数对应,最高位置使用0来表示

ASCII码是当今最通用的单字节编程系统

GB2312(国标2312)

中华人民共和国国家汉字信息交换编码

主要用于给每一个汉字指定相应的数字,也就是进行编码

一个中文字符占两个字节,为了和ASCII区别,将中文字符每一个字节的最高位置使用1来表示

GBK(国标扩展)

除了兼容GB2312外,还兼容繁体中文,生僻字和许多符号进行编码

ISO-8859-1

是西方国家所使用的字符编码集,是一种单字节的字符集,而英文只用了其中数字小于128的部分

Unicode

通用的字符集,对所有语言采用2个字节表示,对于英文字符采用前面加0字符

如"a"ASCII码为0X61,Unicode码为0x00

在internet上传效率低(英文字符前面增加了0,传送了一些没有必要的数据)

UTF-8

可以表示世界上所有的文字

UTF-8是一个不等长的(可以由1个字节表示也可以由2个字节表示)

汉字使用3个字节

获取系统字符集

package com.itlwc;

import java.nio.charset.Charset;

import java.util.Iterator;

import java.util.Set;

import java.util.SortedMap;

/**

* 获取系统所有字符集

*/

public class MyCharset {

public static void main(String[] args) {

SortedMap map = Charset.availableCharsets();

Set set = map.keySet();

Iterator ite = set.iterator();

while (ite.hasNext()) {

String key = ite.next();

Charset value = map.get(key);

System.out.println(key + "--->" + value);

}

}

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值