delphi 如何判断编码格式,解决乱码问题

          前阵子因为需要用到idhttp下载网页,然而令人很生气的是,他下载的html源码是乱码的,这样子是没有办法使用的,所以就必须要把他进行编码格式转换,然而令人困扰的是,他是什么格式,又该怎么转,转成什么格式,这都是问题,转成什么格式,自然是ansi ,可以正常人看的懂的才行了,该怎么转,就必须先知道原先是什么格式了,,他是什么格式,这个就不好办了

          网页格式,不外乎三种,utf8 ,gbk,gb2312,  再细分的话,utf8 属于双字节,gbk,gb2312属于单字节,他们的编码方式分别为 unicode 和ansi ;也就是说,我们下载的网页他们的编码方式就是unicode 和ansi,那么目标明确了我们需要做的是,判断网页到底是哪种编码,二选一,然而很遗憾的是,在网上并没有找到有用的信息,而且也没有找到能够判断字符是属于那种编码的函数,于是自己就想了个方法,写了下面的语句:

function htmlDecode(html:string);
begin
    html:=lowercase(html);
    if (not containtext('charset=',html) or  containtext('=utf',html)) then
    html:=utf8decode(html);
    result:=html;
end;

这个函数对于大多数网页还是有效果的,然而却存在两个问题:
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值