从校园到工作的路(八)——关于编程中的编码问题

编码,我们下意识便会想到UTF-8,GKB这些。
关于在SecureCRT中的编码,还有Eclipse中的编码
ASCII编码只支持基础拉丁字符。其设计:用一个字节(8个位)来表示一个字符,并保证最高位的取值永远为’0’.
ISO 8859-1对应西欧语言,Latin-1是ISO 8859-1的别名。它表示整个西欧的字符集范围。
BOM:Byte Order Mark
![关于中文编码的介绍](https://img-blog.csdn.net/20151113000125059)
UTF-8 BOM又叫UTF-8的签名,对UTF-8没有作用,是为了支持UTF-16,UTF-32.BOM签名是为了告诉编辑器当前文件采用何种编码,方便编辑器识别。虽然BOM在编辑器中不显示,但会产生输出,就像多了一个空行。
全世界统一一种编码。为了能够独立表现世界上的所有字符,Unicode采用四个字节表示一个字符。
为什么会有UTF-8的产生,两个原因:
1、Unicode表示汉字或者拉丁字符,其前面两个或三个字节都是0,这是浪费的。
2、计算机不知道四个字节表示的是Unicode字符还是4个ASCII字符
无论是UTF-8,还是Unicode,其与GBK都是不兼容的,两者之间不能通过任何算法加以转换。如需转换,一般通过GBK查表方式进行。

常见问题及解答:
Windows中的NotePad的编码ANSI保存选项代表什么?
ANSI是windows默认的编码方式。对于英文文件是ASCII编码,对于中文是GB2312编码。所以将一个UTF-8的文件存为ANSI格式,中文部分就会产生乱码。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值