php采集代码乱码问题,php做采集网页 preg_match_all 处理中文的时候出现乱码（已解决）...

最新推荐文章于 2022-09-19 14:00:47 发布

布局图

最新推荐文章于 2022-09-19 14:00:47 发布

阅读量556

点赞数

文章标签： php采集代码乱码问题

php用preg_match_all采集html网页内容时容易出现中文乱码，总结为以下几种解决方案。

1.如果只是简单的编码问题，将当前php文件改成utf8编码试试。

2.如果还是不行，就用iconv进行转码

$content = iconv(”GBK”, “UTF-8″, $content);

$content = mb_convert_encoding($content, “UTF-8″, “GBK”);

preg_match_all("|

(.*)[li>]+>|U",$content, $out, PREG_SET_ORDER);

echo $out[0][0];

$file = file_get_contents("http://blog.xbmu.info");//远程抓取

preg_match_all();//提取信息

//根据需要选择转码:

$str2 = iconv("utf-8", "gb2312//IGNORE",$str2);//把utf转gb2312

$str2 = iconv("gb2312", "utf-8//IGNORE",$str2);//把gb2312转utf

3.当遇到无法确定原编码是何种编码，或者iconv转化后无法正常显示时才用mb_convert_encoding 函数或者mb_ereg_*系列函数，详情参见PHP的Manual。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
php采集代码乱码问题,php做采集网页 preg_match_all 处理中文的时候出现乱码（已解决）...

php用preg_match_all采集html网页内容时容易出现中文乱码，总结为以下几种解决方案。1.如果只是简单的编码问题，将当前php文件改成utf8编码试试。2.如果还是不行，就用iconv进行转码$content = iconv(”GBK”, “UTF-8″, $content);$content = mb_convert_encoding($content, “UTF-8″, “GBK...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。