php读取pdf文件乱码_PHP读取文件,解决中文乱码UTF-8的方法分析

本文实例讲述了PHP读取文件,解决中文乱码UTF-8的方法。分享给大家供大家参考,具体如下:

$opts = array(

'file' => array(

'encoding' => "utf-8"

)

);

$opts = array('http' => array('encoding' => 'utf-8'));

$ctxt = stream_context_create($opts);

$content = file_get_contents($filePath, FILE_TEXT, $ctxt);

最简单的就是将GF2312→UTF-8

$str = iconv("gb2312", "utf-8", $str);

不管用的

$content = mb_convert_encoding($content, "UTF-8", "auto");

******************************************丑陋的分割线来告诉大家上面的不好的:下面的才是正确的方法···哈哈···**********************************************************

define('UTF32_BIG_ENDIAN_BOM', chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF));

define('UTF32_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00));

define('UTF16_BIG_ENDIAN_BOM', chr(0xFE) . chr(0xFF));

define('UTF16_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE));

define('UTF8_BOM', chr(0xEF) . chr(0xBB) . chr(0xBF));

$text = file_get_contents($newPath);

$first2 = substr($text, 0, 2);

$first3 = substr($text, 0, 3);

$first4 = substr($text, 0, 3);

$encodType = "";

if ($first3 == UTF8_BOM)

$encodType = 'UTF-8 BOM';

else if ($first4 == UTF32_BIG_ENDIAN_BOM)

$encodType = 'UTF-32BE';

else if ($first4 == UTF32_LITTLE_ENDIAN_BOM)

$encodType = 'UTF-32LE';

else if ($first2 == UTF16_BIG_ENDIAN_BOM)

$encodType = 'UTF-16BE';

else if ($first2 == UTF16_LITTLE_ENDIAN_BOM)

$encodType = 'UTF-16LE';

$content = file_get_contents($newPath);

$content = iconv($encodType, "utf-8", $content);

终极版·····

$text = file_get_contents($filePath);

//$encodType = mb_detect_encoding($text);

define('UTF32_BIG_ENDIAN_BOM', chr(0x00) . chr(0x00) . chr(0xFE) . chr(0xFF));

define('UTF32_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE) . chr(0x00) . chr(0x00));

define('UTF16_BIG_ENDIAN_BOM', chr(0xFE) . chr(0xFF));

define('UTF16_LITTLE_ENDIAN_BOM', chr(0xFF) . chr(0xFE));

define('UTF8_BOM', chr(0xEF) . chr(0xBB) . chr(0xBF));

$first2 = substr($text, 0, 2);

$first3 = substr($text, 0, 3);

$first4 = substr($text, 0, 3);

$encodType = "";

if ($first3 == UTF8_BOM)

$encodType = 'UTF-8 BOM';

else if ($first4 == UTF32_BIG_ENDIAN_BOM)

$encodType = 'UTF-32BE';

else if ($first4 == UTF32_LITTLE_ENDIAN_BOM)

$encodType = 'UTF-32LE';

else if ($first2 == UTF16_BIG_ENDIAN_BOM)

$encodType = 'UTF-16BE';

else if ($first2 == UTF16_LITTLE_ENDIAN_BOM)

$encodType = 'UTF-16LE';

//下面的判断主要还是判断ANSI编码的·

if ($encodType == '') {//即默认创建的txt文本-ANSI编码的

$content = iconv("GBK", "UTF-8", $text);

} else if ($encodType == 'UTF-8 BOM') {//本来就是UTF-8不用转换

$content = $text;

} else {//其他的格式都转化为UTF-8就可以了

$content = iconv($encodType, "UTF-8", $text);

}

以上的终极版·可以适应中文操作windows系统建立的ANSI``````````````UTF-8`````````Unicode`````的txt文本····

希望本文所述对大家PHP程序设计有所帮助。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值