Unicode编码

Unicode编码表 

        Unicode只有一个字符集,中、日、韩的三种文字占用了Unicode0x30000x9FFF的部分 

        Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符比如汉字""的编码是0x7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制 就是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制, 216次方等于65536,所以UCS-2最多能编码65536个字符。 

        编码从0127的字符与ASCII编码的字符一样,比如字母"a"Unicode 编码是0x0061,十进制是97,"a"ASCII编码是0x61,十进制也是97

        对于汉字的编码,事实上Unicode对汉字支持不怎么好,这也是没办法的简体和繁体总共有六七万个汉字,UCS-2最多能表示65536,才六万 多个,所以Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字 也不过七千多个。

        为了能表示所有汉字,Unicode也有UCS-4规范,就是用 4个字节来编码字符,不过现在普遍采用的还是UCS-2,只用两个字节来编码

        UniCode汉字转换,网上很多,但相对比较好使的比较少,大都写法一样,转换的效果差别不大,或多或少有些遗憾,我这找到个相对较好的,能直接转换标点符号的转换器。

 

在线转换器地址:

http://javawind.net/tools/native2ascii.jsp?action=transform

 

Unicode汉字编码表

http://www.cnblogs.com/whiteyun/archive/2010/07/06/1772218.html

 

UniCode编码表

https://www.cnblogs.com/csguo/p/7401874.html

 

最为透彻的utf-8unicode详解

https://blog.csdn.net/tcf_jingfeng/article/details/80134600

 

  • 7
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值