php tidy处理中文乱码问题

用PHP的TIDY处理中文网页时,结果总是乱码,总结肯定是字符编码的问题,经过研究发现一定要设置TIDY的字符属性

//  "char-encoding" => "raw",
//  "input-encoding" => "raw",
"output-encoding" => "raw"

以两个设不设置没有关系,因为主要看输出。

设置为"raw"后,TIDY将直接输出超过127的字符,而不再对它们进行编码。

但这之前,你因为保证原始的编码是PHP可读的,

如果原始编码是ASCII的好像是无法转到UTF8的,必须是UTF8转UTF8,这块比较乱,如果谁搞明白了,请给我留言吧

反正如果你是ASCII编码的中文把输出设置成raw就对了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值