关于字符编码与word微软雅黑字体的抽风浅析

问题:word中出现大量微软雅黑字体无法更改字体,格式刷、清除格式等统统没用。

先说解决办法,应该也是唯一的高效解决办法,就是使用QQ识图,在登陆QQ的情况下ctrl+alt+o,框选文本,然后复制识图结果,再复制到word就可以正常编辑。

下面讲一下本人经历和研究成果

最近忙着论文的事情,本着读书人的事怎么能算偷的精神,试图在网上剽窃他人劳动成果,精准地选中,优雅的cv结束之后,大家都知道,网页字体和排版肯定是乱七八糟不合要求,遂更改字体和行距,然而尴尬的事来了,字体怎么改怎么错,要不没反应要不反应很迷,具体如下,仔细看字体,有明显差别,且word无法更改,选中一看,微软雅黑,死活改不掉。

于是百般折腾,熬了几个小时,终于在互联网的犄角旮旯里找到了答案。下边贴个改好的效果图。

首先解释一下字符编码,计算机只能存储二进制数,为了显示文字,就需要特定的映射,这个映射就叫字符编码,本来几乎每种文字都被赋予了自己的编码,如汉字(GB2312),但苦于乱码(显示端不支持想要显示的文本的编码格式)的困扰,于是Unicode编码出现了,意图统一编码格式,让全世界的计算机都使用同一种编码语言,远离乱码惨剧,然而事情并不是那么美,世界很大,地区很多,文字也很多,文字之间的关系也是错综复杂,有同字不同音,同字不同意,以及地区之间文字的借鉴学习导致统一编码难于登天(感兴趣的去搜unicode了解字符编码发展过程),其中我们经常遇到的word格式问题就来自于unicode字符中的康熙部首部分,如下图

兄弟们火眼金睛,应该认得出来这几个妖孽,就是他们导致word抽风,下边解释一下,word之所以无法更改,是因为word里基本上除了微软雅黑(抽风的字所用字体)没有字体有为康熙部首做字体,所以word自然无法应用其他字体,行间距的问题则是因为word对于不同的字体排版不同,所以设置的行间距相比宋体大了很多。这个康熙部首属于unicode编码的扩展字符,用来收录康熙词典里的部首,本来这是一件好事,但是据本人浅浅推测,应该是大家为了保护资源,将文字转为图片等上传,而一些机构为了剽窃资源使用不合理的识别机制将正常的文字识别成了部首(可能是因为编码比较靠前且为了识别速度没有考虑语义,这里不深究),最终使我们这样食物链底端的小卡拉米遭了殃。

QQ使用云上传服务器识别,拥有语义识别等高级功能,所以不会出现这样的低级错误,而且可以把这些个妖孽打回原形,理论上所有支持语义识别的软件都可以,等等看有没有大神用api写个一键转换工具吧。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值