Unicode 东亚字符

本文介绍了Unicode 6.2文档中的东亚字符,统称为CJK规范,涵盖了汉语、日语、韩语、越南语等多种语言的象形字符。这些字符在Unicode中的集合包括了多个已有的字符集,如中国的GB2312。举例说明了字符'一'(HEX值4E00)的来源,并提到了最常用的字符块——CJK Unified Ideographs,其取值范围为4E00–9FFF。
摘要由CSDN通过智能技术生成

本文主要参考Unicode 6.2的文档ch12.pdf. 由于文档内容实在太多,仅摘出我理解的部分。

基本思想就是Unicode中的东亚字符有一个统一的名称:CJK规范。而CJK的字符集合就是汉语象形字符集合,在Unicode中,汉语象形字符集已经包括了中,日,韩,越南,彝族等语言,规范来源子多个已经存在的字符集,比如中国的GB2312,香港,台湾,日本等。


概述:

1.在Unicode标准中,东亚字体也被称为汉字。汉字从公元2000年前沿用至今。中国周围的文明,经常对汉字进行修改用来书写他们自己的语言。日本,韩国和越南都借鉴并修改了汉字。
2.在日本,除了仍在使用汉字外,还增加了平甲名和片甲名。
3.在朝鲜,一开始也是使用汉字,后来发明了韩文。现在是同时使用汉字和韩文。
4.在越南,用汉字的规则创造了一些本地文字。这些文字在20世纪初开始使用,也偶尔用于标志和有限的上下文环境中。
5.彝族一开始模仿汉字发明了一些文字。现代彝族语言是从这个基础上派生出来的。
6.中文也发明了汉语拼音,用来表示中文的发音。
7.上述东亚语言,都将字符书写在一个矩形内(通常是正方形)。汉字传统书写方向是至上而下,从右至左。受西方印刷技术的影响,现在多数是水平的,从左到右书写。很多老字符集包含了简化东亚语言的一些字符,比如标点符号的各种形式,半宽度和全宽度字符。Unicode规范包含了这些以兼容旧的标准。

汉语:
CJK统一文字
由于汉字使用的时候常常混合其他语言的字符,比如拉丁文和其他。如果包含早期的越南文字,名称用C
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值