Delphi 编码错误问题

开发工具:Delphi 10.2  

在工作中遇到一个问题,我需要将json类型的数据进行解析,代码如下:         JsonFile:=TStringList.Create;
        JsonFile.LoadFromFile(FileName);
        //  pageSize:=JSONFile.Text;
       Js.Parse(JSONFile.Text);

但是在调试执行Js.Parse(JSONFile.Text);这一行的时候报错了,于是添加了pageSize:=JSONFile.Text;这一行并打断点进行调试发现源文件中的中文字符变成了乱码,‘男’变成了‘鐢’。

于在网上查找原因,是因为GBK编码转UTF8编码时出现了错误,原因是utf-8中,一个字母用一个字节表示,一个汉字用三个字节表示,特殊的汉字用四个字节表示,而gbk中,一个字母用一个字节表示,一个汉字用两个字节表示。

我的解决办法如下:

把源文件编码格式改为UTF8,然后设置读取文件时候的格式为UTF8就行

关键源码如下(Stream是TFileStream类、Reader是TStreamReader类、ResultStr是string类型、Js是TQJson类):

Stream := TFileStream.Create(FileName, fmOpenRead or fmShareDenyWrite);
Reader := TStreamReader.Create(Stream, TEncoding.UTF8);
ResultStr := Reader.ReadToEnd;
Js.Parse(ResultStr);

能成功获取到正确的中文格式字符串

一个题外话:

在解决这个问题的时候,其实不太顺利,在找到错误原因是GBK编码转UTF8编码时出现了错误后,我的第一个想法是怎么将GBK编码的中文字符串正确转为UTF8编码的字符串。但是没有成功,不过好像我的这个函数是对的成功的,在网上找了很久没有找到相关的源码,于是分享出来,有需要的可以拿去试试。如下代码,可以将GBK编码的字符串转为UTF8编码的字符串:

function GBKtoUFT8(GBKStr:string):string;
var
  UTF8Str: TBytes;
  UTF8Bytes:TBytes;
  GBKEncoding: TEncoding;
  UTF8Encoding: TEncoding;
begin
//  GBKStr := '哈哈哈哈啊哈,终于转成功啦呵呵哈哈哈hhh111,haokaixin jiangli yipian boke';

  // 将GBK编码的字符串转换为字节流
  GBKEncoding := TEncoding.GetEncoding('GBK');
  UTF8Str := GBKEncoding.getBytes(GBKStr);

  // 将UTF-8编码的字节流转换为字符串
//  bytes := TEncoding.UTF8.GetBytes(UTF8Str);
  UTF8Encoding := TEncoding.UTF8;
  UTF8Bytes := UTF8Encoding.GetBytes(GBKEncoding.GetString(UTF8Str));
  result:= UTF8Encoding.GetString(UTF8Bytes);
end;
  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值