unicode 生僻字_【技术贴】快速输入生僻字

79eb35e70c4e52c71561a2ac292a5ef3.png

〇、写在前面的话(可跳过)

前几天看到个问题,询问如何在电脑上输入生僻的隶定字。这个问题有点专业,我的回答也比较有针对性。本文在该回答的基础上增补改写,希望对更多朋友有所帮助。原答案如下:

电脑上如何输入隶定后的古文字生僻字?​www.zhihu.com
1d92e773390b9df478c4caf889496dac.png

几年来,我整理的文献也有不少,经常和各种生僻字、隶定字、未编码字打交道,也算是久病成医,可以分享一下心得。比如下面是我整理《王国维全集·联绵字谱》的截图,该书中的很多字对一般人来说都是见所未见的生僻字,我也认识不了几个,如果没有方便的输入方式,整理的难度相当大。

213bbdc6ce66b75675942533056e0a1f.png

《联绵字谱》看着复杂,但好在上面的字全部都出自古代常见典籍,已编码,都可以打出来。但如果你用市面上商业输入法,恐怕就要大失所望了,很多明明编码的字,就是打不出来。我曾经和中国某家著名输入法的相关负责人聊过,为什么该输入法不扩大字库,是担心影响输入速度?还是怕增大文件体积?对方回答的很实在,用的人少,何必麻烦。的确,虽然对于我们这些经常和文字打交道的人来说,输入需求很迫切,但一般用户确实并不需要。

为此,我用了三种中文输入法搭配使用。


一、我们需要什么样的输入法?

1、商业输入法(搜狗、百度、手心……任选)

商业输入法在一般情况下输入速度是最快的,特别是打一个长长的句子,联想功能可以节省很多敲击。

搜狗输入法推出了U模式。在输入之前按U,可以将汉字拆分成部件或笔画。如:林=木+木。输入umumu就可以打出林。缺点是商业输入法能打出的字太少。(这个「太少」是相对的,输入常规字应该是够用了。)

我在使用搜狗输入法的时候,还按照自己的需求做了些修改。详见我的这篇知文。

周旭:【技术贴】改造我们的输入法——以搜狗为例​zhuanlan.zhihu.com
8cfbd5cf07f108b336bcdf6c01d849fe.png

781232ad86d143fb0add95c4070a240c.png

2、字海网(叶典网)推出的两分输入法。

这种输入法很有趣,把任意汉字都拆成两部分,然后用拼音输入。比如:海=氵+每。输入shuimei即可。对于不认识的生僻字,只要能拆成两部分,就可以很快输入。当然也有缺点,有些独体字是无法拆成两部分的,该输入法也要拆开,所拆的结果往往很难想到。

f04de1f0a0f6fe8d9ddfbc7028500272.png

有时候即使拆成了两部分,却不一定知道对应的拼音是什么。比如:

冫不读bing,读shui。

彳不读chi,读ren。

宀不读mian,读gai。

冖不读mi,读gai。

作为笔画的【折】不读zhe,读yi(乙)。

还有其他待补充。总之,看着像什么就读什么。

详情请见http://yedict.com/download/

如果会配置rime输入法,可以用rime版。不会的话可以用多多版。

3、中华书局古联输入法。

分三种输入方式:1、直接输拼音。2、u+笔画,按笔画输入。3、i+部件,按部件输入。

官网教程很清晰,就不赘述了。说一下缺点吧。

首先,有点卡,第一次见到这么卡的输入法(笑)。

其次、拼音输入模式只能输入单字,不能代替商业输入法。

第三点也是最可能会被坑的一点:可以输入没有编码的字,这些字是不会被承认的,只能用中华书局的字体显示。如果你输入之后,复制发给朋友,朋友可能看到一堆乱码,除非他也装中华书局的字体。

详情请见http://www.ancientbooks.cn/helpcore?input

4、其他输入法。有些朋友很会利用rime自己造输入法。有兴趣的可以搜搜,我就不多说了。五笔、郑码、仓颉……很多输入法都有办法输入更多汉字,不过由于我目前的输入方法已经满足需求了,就没有继续学习。

5、曲线救国,我输入不了,我可以拼出来。

引得市的部件检索(http://www.mebag.com/index/)。

国学大师的拆分查字(http://www.guoxuedashi.com)。

字海网(叶典网)的两分查字(http://zisea.com/zslf.htm)。


二、什么字体能显示出生僻字

有了输入法并非万事大吉,如果没有合适的字体,原本应该出现文字的地方可能就会变成一堆豆腐块或者干脆空白。你需要覆盖范围更大的字体。

汉字编码不是一下子完成的。简单说,最开始收了很多字,放在一个区域,我们把它叫做基本区。然后又收了一些字,我们叫做扩展A区。後来又收了一批,叫扩展B区。以此类推。大部分字体可能连基本区的字都收不完,稍微好一点的字体符合GBK标准,再好一点的符合GB18030标准。但最多也只是收到B区。

为什么不多收字呢?和输入法问题一样。制作者认为没必要。更何况,比起输入法关联,造字的成本是巨大的。

下面推荐几款收字较多的字体。

1、花园明朝体。完全免费,但是字形和大陆字体字形差异很大,很多人觉得丑。

(官网我也打不开了。网上一搜很容易搜到,如果字体分AB,全部安装即可。)

5e7c48360f61650c4fadb3ea37a1b115.png

2、字海网(叶典网)推出的天珩全字库。

字体和字库是不同概念,但你不用管那么多,安装之后能用就行。

该网站声明:本字库属于非盈利的、学习研究型的字库,目的是为了汉字的显示,不制作或出售任何商业作品。字形版权:中易、华康、Iwata、Besta、方正。本字库中字体的字形均为上述公司制作,非本软件作者制作。本字库的字体属于已经公开的字体,故本字库仅仅起到收集整理的作用,方便用户使用。作者并未对字体做出任何有意义的改动,若有任何人以本字库的名义收取任何费用,本字库作者不承担任何连带责任。

详情请见http://yedict.com/download/

cf320b6bf703a28e179d365d05000326.png

3、国学大师推出的开心宋体。

该网站声明:唯一完全显示本站汉字的字体:开心宋体

详情请见:http://www.guoxuedashi.com

10227ef57fbb963cee9b25a053084e3d.png

4、中华书局宋体字库。

该网站介绍的很详细,可以仔细读读。

详情请见:http://www.ancientbooks.cn/helpcore?font

5f0d7f538a9c5549f8a0e1eea3612f70.png

基本上凡是已编码的字,这些字体就够了。中华书局宋体字库里面还有一些未编码的字,比如金文常见,但一直未编码的[⿰阝尊]。但是如果没有安装这个字体,可就看不见了。所以建议大家慎重使用。这里为了能在知乎显示,也只能用截图。

ab802ed0890cf0531be54154c5a35641.png

三、插图大法好

刚刚和大家说的是输入法和字体的事。其实对于古文字学者来说,插图才是最常见的。比如友人正在制作的《甲骨文分组分类字编》。

d9419ae6cd6c715dbe29218f433dd0e7.png

看着还不错吧。我们把页面调暗再看一下。

b4fa73f505d40a37a76bb486aac28539.png

不光甲骨文用的插图,[⿱宀羊]也是用插图实现的。

友人的图片都是用电脑自带的「画图」工具抠出来的,事实证明,只要用心做,就能得到很好的效果。

其实[⿱宀羊]这个字已经编码了,unicode:2BCC5。在扩展E区。一般字体不支持。

再看一下他做的其他图(为加大对比,用了夸张的底色)。

064d833250b2f17b02fb9c24996194e3.png

插图法最常用,也最方便。特别是出版社也喜欢这样的书稿。一般出版社会重新制图或为插图造字。

在这个过程中就很考验编辑的文字功底了,丑不丑是一方面,很多编辑会把书稿中正确的字形弄错,出过古文字类的书的朋友应该都有同感。


四、构字式

用构字式呈现文字的结果也是常用方法,缺点是臃肿累赘,且有些字形太复杂无法用构字式表示。但我还是挺喜欢用的:例如:你=⿰亻尔。⿰表示左右结构。⿰⿱⿲⿳⿴⿵⿶⿷⿸⿹⿺⿻

详见前知乎大V趙瑾昀氏

趙瑾昀:如何精确地表示生僻字​zhuanlan.zhihu.com
dcec94ed1e51bf82d9df96a3d49fda0a.png

五、造字

我基本不用造字,麻烦不说。造出来的字发给别人也无法显示。也不利于出版。

希望大家能不造字就别造。


六、特别说明

在古文字领域,有很多人用吴振烽老师的「金文通鉴」,通鉴自带一种金文字体,可以显示全部金文隶定字。

但这种字体其实是有缺陷的,它直接占用了韩文(谚文)的码位。别人输入的是韩文,但这种字体会把它显示为金文隶定字。反之,你以为你输入的是金文,但没有安装该字体,就变成一堆韩文了。于是,百度百科中、教师的PPT上,甚至一些论文里,铭文中混着的韩文特别显眼。比如下面这个利簋的释文。所以说,引用通鉴最好随手截图。

珷(武)征商,隹(唯)甲(子)朝,(歲)鼎(貞),克(昏),(夙)又(有)商。辛未,王才(在)(管)(師),易(錫)又(右)事(史)利金,用乍(作)公寶(尊)彝。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值