delphi保存读取utf-8的文本文件

给客户做了一个批量识别图像并合成双层pdf的程序,最后客户需要生成的同时附带一份记事本文件,就是OCR过后的文本,并指定utf-8格式的。在处理utf-8时出现了点小问题,现在总结如下

首先 利用delphi自带的UTF8Encode函数,将普通字符转换为utf-8编码

创建一个流,MemoryStream或FileStream都可

函数看起来如下

[quote][b]procedure[/b] SaveUTF8File(AContent:WideString;AFileName: string);
[b]var[/b]
ffileStream:TFileStream;
futf8Bytes: string;
S: string;
[b]begin[/b]
ffileStream:=TFileStream.Create(AFileName,fmCreate);
futf8Bytes:= UTF8Encode(AContent);
ffileStream.Write(futf8Bytes[1],Length(futf8Bytes));
ffileStream.Free;
[b]end[/b];[/quote]

运行后查看生成的文件,全是乱码,上网搜索发现

unicode文本文件:头两个字符分别是FF FE(16进制)
utf-8文本文件:头两个字符分别是EF BB(16进制)

原来是忘了把文件头加进去了

于是加入代码后
[quote][b]procedure[/b] SaveUTF8File(AContent:WideString;AFileName: string);
[b]var[/b]
ffileStream:TFileStream;
futf8Bytes: string;
S: string;
[b]begin[/b]
ffileStream:=TFileStream.Create(AFileName,fmCreate);
futf8Bytes:= UTF8Encode(AContent);
S:=#$EF#$BB#$BF;
ffileStream.Write(S[1],Length(S));
ffileStream.Write(futf8Bytes[1],Length(futf8Bytes));
ffileStream.Free;
[b]end[/b];[/quote]

保存文件后查看,还是乱码。找了半天问题最后终于发现问题出现在声明的参数WideString上,改成string就没问题了。

最后生成 的代码如下

[quote][b]procedure[/b] SaveUTF8File([color=red]AContent:string;[/color]AFileName: string);
var
ffileStream:TFileStream;
futf8Bytes: string;
S: string;
[b]begin[/b]
ffileStream:=TFileStream.Create(AFileName,fmCreate);
futf8Bytes:= UTF8Encode(AContent);
S:=#$EF#$BB#$BF;
ffileStream.Write(S[1],Length(S));
ffileStream.Write(futf8Bytes[1],Length(futf8Bytes));
ffileStream.Free;
[b]end[/b];[/quote]

再附上一段读取utf-8文本的代码

[quote][b]function[/b] LoadUTF8File(AFileName: string): string;
[b]var[/b]
ffileStream:TFileStream;
fAnsiBytes: string;
S: string;
[b]begin[/b]
ffileStream:=TFileStream.Create(AFileName,fmOpenRead);
SetLength(S,ffileStream.Size);
ffileStream.Read(S[1],Length(S));
fAnsiBytes:= UTF8Decode(Copy(S,4,MaxInt));
Result:= fAnsiBytes;
[b]end[/b];[/quote]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值