Unihan(统汉字)常用字段介绍

本文介绍了Unicode的Unihan数据库,包括Unihan_IRGSources.txt、Unihan_DictionaryIndices.txt、Unihan_DictionaryLikeData.txt、Unihan_OtherMappings.txt、Unihan_RadicalStrokeCounts.txt、Unihan_Readings.txt和Unihan_Variants.txt等文件的内容,涵盖了汉字的发音、变体、部首、字典索引和编码映射等信息。
摘要由CSDN通过智能技术生成

0 背景

统汉字数据库是Unicode标准包含的中日韩统一表意文字集体知识的存储库。它包含映射数据来实现与其他编码字符集相互转换,和附加信息来帮助实现对使用汉字表意文字的各种语言的支持。简单来讲就是我们见得Unicode中的CJK部分。

在此介绍的是 Unihan Database 中的一些字段内容。
Unihan.zip : ftp://ftp.unicode.org/Public/UNIDATA/Unihan

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值