c# 汉字编码

最新推荐文章于 2023-07-14 21:33:40 发布

weixin_33869377

最新推荐文章于 2023-07-14 21:33:40 发布

阅读量773

点赞数

文章标签： c#

原文链接：http://www.cnblogs.com/hustliangchen/archive/2008/05/29/1209994.html

版权

    当用流向文本文件中写入，或用流将文本文件内容读到textbox中是，我们会遇到汉字无法识别，出现乱码等情况，究其原因就是中文系统中文件的编码（encoding）和流的encoding方式不对应。
    文本编辑器（比如XP自带的记事本）在生成文本文件时，如果编码格式和系统默认的编码（中文系统下默认为GB2312）不一致时，会在txt文件开头部分添加特定的“编码字节序标识（Encoding Bit Order Madk，简写为BOM）”，类似PE格式的"MZ"文件头。这样它在读取时就可以根据这个BOM来确定该文本文件生成时所使用的Encoding。这个BOM我们用记事本等程序打开默认是看不到的，但是用stream按字节读取时是可以读到的。我的这个TxtFileEncoding类就是根据这个BOM“文件头”来确定txt文件生成时用到的编码的。
解决方式如下：
    a.对中文文本进行编码，并写入文本文件：