转载的优秀文章
文章平均质量分 91
这是我转载的其他博主的优秀文章,写得太好了,妙不可言。
Jonny Z
抱紧大佬大腿
展开
-
一文搞清楚中文编码们:GB2312, GBK, GB18030, Big5
前一篇我转载的这个博主的博文:ANSI是什么编码?中有这样一段小故事:话说计算机是由美国佬搞出来的嘛,他们觉得一个字节(可以表示256个编码)表示英语世界里所有的字母、数字和常用特殊符号已经绰绰有余了(其实ASCII只用了前127个编码)。后来欧洲人不干了,法国人说:我需要在小写字母加上变音符号(如:é),德国人说:我也要加几个字母(Ä ä、Ö ö、Ü ü、ß)。于是,欧洲人就将ASCII没用完的编码(128-255)为自己特有的符号编码(后来称之为“扩展字符集”)。等到我们中国人开始使用计算机的时候,转载 2021-05-01 01:57:18 · 891 阅读 · 1 评论 -
彻底搞清楚有的编辑软件中存在的 ANSI 编码到底是什么?
用Notepad++创建一个文本文件text.txt,其默认编码格式为ANSI(乍看之下,还以为是ASCII呢),输入汉字居然不是乱码:保存为test.txt,发送给你美国的同事Bob。他也用Notepad++,不幸的是,却发现你的文件内容是这样的:也许你会认为:你用的是中文系统,能正常显示中文;他用的是英文系统,不能显示中文!这么想,好像很有道理呢!但是再细想一下:一个系统显示乱码,说明它不支持这种编码格式(或者解码方式不对)。难道英文系统不支持ANSI?难道ANSI是一种中文编码?如转载 2021-05-01 01:48:24 · 851 阅读 · 1 评论 -
Unicode, UTF-8, UTF-16, UTF-32, UCS-2, UCS-4是什么?
Unicode与ISO 10646全世界很多个国家都在为自己的文字编码,并且互不想通,不同的语言字符编码值相同却代表不同的符号(例如:韩文编码EUC-KR中“한국어”的编码值正好是汉字编码GBK中的“茄惫绢”)。因此,同一份文档,拷贝至不同语言的机器,就可能成了乱码,于是人们就想:我们能不能定义一个超大的字符集,它可以容纳全世界所有的文字字符,再对它们统一进行编码,让每一个字符都对应一个不同的编码值,从而就不会再有乱码了。如果说“各个国家都在为自己文字独立编码”是百家争鸣,那么“建立世界统一的字符编转载 2021-05-01 01:14:10 · 857 阅读 · 1 评论