[译] Z-variant (Z变体)

阅读目录

Unihan 的 kZVariant 字段
译自: en.wikipedia.org/wiki/Z-variant | 已发布zh.wiki

在Unicode中,如果两个字形共享相同的词源(etymology),但外观和Unicode字符编码稍有不同,则两个字形互为Z变体(通常拼写为zVariants)。例如,Unicode字符U+8AAA 說 和U+8AAC 説 互为Z变体。Z变体的概念只适用于“CJKV 文字” (中文,日语,韩语和越南语),中日韩越统一表意文字的副标题。

1. Z轴上的区别

CJK 的 unicode 编码的分配通过三个"轴"来组织。X轴表示语义上的差异;例如,拉丁大写字母A(U + 0041A)和希腊字母α的大写字母(U + 0391A)在Unicode中由两个不同的编码表示,称为“X变体”(尽管这个术语并不常见)。Y轴表示外观上的显著差异,语义上差异不大;例如,繁体字“猫”(u+8c93 貓)和简体字(u+732b 猫 )互为Y变体。

Z轴表示较小的印刷差异。 例如,中文字符(U+838A 莊)和(U+8358荘)是Z变体, (U+8AAA 說) 和 (U+8AAC 説) 也同样是Z变体。 Unicode.org 的术语表中,将“Z-变体”定义为“两个具有相同语义和统一形状的CJK统一表意文字”,或者是在CJKV统一表意文字中。

可以这样讲,如果CJK统一表意文字是完美“统一”的,Z变体也不会出现。它的出现是为了帮助文本在Unicode和其他CJK编码——比如Big5和CCCII——之间"往返"。例如,字符 “莊” 的CCCII编码为 21552D,同时其Z变体 “荘” 则有CCCII编码 2D552D。这两个变体分别被赋予了不同的Unicode码,因此可以无损的将文本在CCCII编码和Unicode码之间转换。

2. 问题

关于"Z变体"确切的定义, 还存在一些疑惑。例如,在2002年的一项 Internet草案 (RFC 3743)中, (U+4E0D 不) 和 (U+F967 不) 被定义为“字形变体(font variants)”,而普通话中的 (U+5154 兔) 和日语中的(U+514E 兎) ——语义都是“兔子”——则都被Unicode联盟的统汉字数据库认为是Z变体。

转载于:https://www.cnblogs.com/Comero/p/8993544.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值