VBScript将字符串保存为UTF-8编码不带BOM的文本文件

dgiij

于 2024-03-06 13:34:27 发布

阅读量386

点赞数 2

文章标签： windows .net

本文链接：https://blog.csdn.net/dgiij/article/details/136503015

版权

VBScript中使用ADODB.Stream保存编码为UTF-8的文件，默认是会带上BOM标识的，在一些场景中，我们需要的是不带BOM标识的UTF-8文件，那么需要对文件进行一下处理，简单来说就是去掉带BOM的UTF-8文件的前3个字节，重新保存。
很多例程是先将整个字符串写入UTF-8的文本流，然后指针定位到第3个字节的位置，另外重新建立一个二进制流，将文本流的数据Copy到二进制流，然后二进制流写入文件就得到无BOM的UTF-8文件。没有毛病，我也是这样处理的。
后来看到有网友推荐了一个高级玩法，说前面的处理方式是要将整个字符串编码写入两个流，当字符串很长时，有空间和性能的较多开销，可以在文本流中仅写入一个字符，然后Copy到二进制流，然后在二进制流中进行以下操作：设置结尾标识，计算下流长度，然后重新定位到起始位置，更改流类型为文本流，UTF-8编码，然后再定位到第一个字符编码位置后，写入原字符串后面的所有字符信息，然后再定位到起始位置，更改流类型为二进制流，然后写入文件，这样也可以一个得到没有BOM的UTF-8的文本文件了。这里有几个要点：WriteText如果不是从开头写文本，那么是不会带上BOM标识的，只有定位到流开头Position = 0 才能更改流类型，还有就是UTF-8的文本流写入文件还是会带上BOM标识的。
代码如下：

'VBScript脚本 teststr2utf8.vbs
Sub String2UTF8_WithoutBOM(str,filepath)

	Set fs = CreateObject("ADODB.Stream")
	fs.Type = 2
	fs.Mode = 3
	fs.Charset = "utf-8"
	fs.Open '创建一个文本流
	fs.WriteText left(str,1) '写入字符串的第一个字符
	fs.Position = 3 '前3个字符是UTF-8的BOM标识，下面写入二进制流时跳过

	Set fsnb = CreateObject("ADODB.Stream")
	fsnb.Type = 1
	fsnb.Open '创建一个二进制流
	fs.CopyTo fsnb '写入字符串第一个字符的UTF-8编码
	fs.Close() '关闭fs流
	Set fs = Nothing '后面的操作用不到fs流了

	fsnb.SetEOS() '设置流结尾
	len1=fsnb.Size '取得字符串第一个字符的UTF-8编码长度
	fsnb.Position = 0 '只有当Position=0时，才能改流类型
	fsnb.Type = 2 '更改为文本流
	fsnb.Charset = "utf-8"
	fsnb.Position = len1 '流定位到字符串第一个字符后
	fsnb.WriteText right(str,Len(str)-1) '写入字符串后面的所有字符
	fsnb.SetEOS() '设置流结尾
	fsnb.Position = 0
	fsnb.Type = 1 '更改为二进制流
	fsnb.SaveToFile filepath, 2 '写入UTF-8不带BOM的文件

	fsnb.Close()
	Set fsnb = Nothing
End Sub

'测试下，看看效果
str="Hello, world! 你好，世界！"
filepath="utf-8file.txt"
String2UTF8_WithoutBOM str,filepath

dgiij

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
VBScript将字符串保存为UTF-8编码不带BOM的文本文件

后来看到有网友推荐了一个高级玩法，说前面的处理方式是要将整个字符串编码写入两个流，当字符串很长时，有空间和性能的较多开销，可以在文本流中仅写入一个字符，然后Copy到二进制流，然后在二进制流中进行以下操作：设置结尾标识，计算下流长度，然后重新定位到起始位置，更改流类型为文本流，UTF-8编码，然后再定位到第一个字符编码位置后，写入原字符串后面的所有字符信息，然后再定位到起始位置，更改流类型为二进制流，然后写入文件，这样也可以一个得到没有BOM的UTF-8的文本文件了。没有毛病，我也是这样处理的。
复制链接

扫一扫