文本编码格式

今天突然就想研究一下记事本和写字版的区别,然后就看到了在“保存”对话框中各自支持的格式。进行了一些测试,本想贴个表格在这里,不过太麻烦了,先文字表述一下吧。

写字板可以保存成:RTF,文本,文本DOS,Unicode。
记事本可以保存成:ANSI,Unicode,Unicode Big-Endian,UTF-8。
RTF文件用纯文本保存着格式信息,空文件就含有一些。
文本文件的普通与MS-DOS格式相同。
Unicode文件头有FFFE标识,英文字符及半角标点的Unicode码为ANSI码加00。
ANSI的英文字符及半角标点同AscII码。
Unicode的Big Endian与Little Endian每两个字节一换,文件头也相反。
UTF-8文件在Ultraedit-32的编辑界面中看到的和Unicode的一样,但是进行文件比较时却显示出另一串代码,我想是Ultraedit在显示时自动作了转换吧。而实际的情况与对比时看到的相同,文件头EFBBBF,英文字符及半角标点和Unicode相同,中文5字节,全角标点3字节。
除UTF-8外,其余编码的中文为4字节,全角标点2字节。



=============================

原文时间:2005.07.25
原文地址:http://mnky.bokee.com/2386358.html


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值