编码
杨陈菊
whether you are lion or gazelle you must sprint for survival
展开
-
java 输出13060个繁体字集的Unicode码
BIG5是目前中国台湾和中国香港地区普遍使用的一种繁体汉字的编码标准,包括440个符号,一级汉字5401个,二级汉字7652个,共计13060个汉字,所谓一级汉字与二级汉字对应于常用汉字和不常用汉字。关于编码问题可参考我的另一篇文章:我所了解的GB2312、Unicode、GBK、UFT-8、BIG5等编码。本文主要通过 java 对BIG5编码中的13060个繁体汉字转换成对应的Unicod...原创 2018-11-18 21:05:31 · 1948 阅读 · 0 评论 -
趣谈unicode,ansi,utf-8,unicode big endian这些编码有什么区别
从头讲讲编码的故事。那么就让我们找个草堆坐下,先抽口烟,看看夜晚天空上的银河,然后想一想要从哪里开始讲起。嗯,也许这样开始比较好…… 很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们看到8个开关状态是好的,于是他们把这称为"字节"。 再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状...转载 2018-11-17 10:25:43 · 346 阅读 · 0 评论 -
我所了解的GB2312、Unicode、GBK、UTF-8、BIG5等编码
小编一直对文字编码感到模糊,在学习、编程等过程中也经常会遇到与之相关的问题,无奈只能问百度。于是,为解决这一问题,小编花了一些时日了解和学习这些编码,整理出了这些编码的“性格特点”,“兴趣爱好”等等(文章中可能不全面,接受建议)。有关文章参见:趣谈unicode,ansi,utf-8,unicode big endian这些编码有什么区别。在这之前,我得先提一下ASCII码(American ...原创 2018-11-18 11:29:06 · 9459 阅读 · 0 评论