vb.net 教程 4-7 文本文件编码 1

版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。

经常上网的人有时候会发现出来的网页,上面的字居然不认识,这就是所谓的”乱码“。

这是因为浏览器不能识别网页原有的文字编码方式,而使用了不同的文字编码方式造成的。

例如在百度首页的编码是用的Utf-8:

在网页上点击鼠标右键查看编码一项,可以看出,浏览器自动选择了”UTF-8“:

如果强制转为GB2312,那么就会产生乱码:

同样的,打开文本文件时,需要指定编码方式,这样才能获得正确的文字。

计算机最开始只有ASCII编码,包含了字母、数字、一些标点符号和特殊符号。

但是随着计算机广泛运用,ASCII越来越不能满足计算机发展需要。

于是相继产生了Unicode、中文的GB2312、繁体中文Big5、日语shift_jis等等。

不同的编码获得的内容不同。

.net中直接提供了

Encoding.ASCII
Encoding.Unicode
Encoding.UTF32
Encoding.UTF7
Encoding.UTF8

可以使用,

如果要使用其他编码,可以使用如下方式,例如使用GB2312编码:

Dim enc As Encoding
enc = Encoding.GetEncoding("gb2312")
.net还提供了

Encoding.Default

这也是后面几节代码中主要用到的,虽然.net不提倡用:

我这里使用主要是为了简化。实际文本编码的时候最好请使用Unicode编码。

关于更多编码的详细内容请参看 System.Text.Encoding一章 或 自行在网上搜索相关内容。

下一节,我将用一个简单的例子说明。

学习更多vb.net知识,请参看 vb.net教程 目录

 
————————————————
版权声明:本文为CSDN博主「VB.Net」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值