php 单字节,php – 单字节字符编码的两个字节字符(ISO-8859-1)HTML文档

我了解到ISO-8859-1是一个单字节字符集.

HTTP标头和元标记告诉它使用ISO-8859-1作为字符编码.

¼ÈØOVA¢: ÜÍß‚Äí 1.28 ...

如何在单字节编码中使用双字节字符?

我不了解这一点并不是好奇心.由于不了解上述问题,我的任务之一被搁置了.

更新:他们正在使用字体www.manoramaonline.com/portal/mmcss/Manorama.ttf,我认为Manaorama字体中的一些字符使用两个字节.

UPDATE2:我尝试使用以下代码将文档从ISO-8859-1转换为UTF-8.

$t = file_get_contents('http://www.manoramaonline.com/cgi-bin/MMOnline.dll/portal/ep/malayalamContentView.do?tabId=11&programId=1073753760&BV_ID=@@@&contentId=15238737&contentType=EDITORIAL&articleType=Malayalam%20News');

// Change the charset info in meta-tag

$t = str_replace('ISO-8859-1', 'UTF-8', $t);

file_put_contents('t.html', utf8_encode($t));

那个时候缺少上面选择的字符.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值