domdocument php charset gbk,php抓取gbk编码页面中文乱码解决方法

最新推荐文章于 2021-11-10 14:53:19 发布

息相吹

最新推荐文章于 2021-11-10 14:53:19 发布

阅读量125

点赞数

文章标签： domdocument php charset gbk

php抓取gbk编码中文乱码多种解决方法

今天做项目，抓取了一个gbk编码的页面后发生中文乱码，最后找到解决方案是：

使用：$content = mb_convert_encoding($content ,'HTML-ENTITIES',"GBK");转码后就好了。$url = 'http://www.juming.com/ykj?api_sou=1&tao='.$id.'&ymlx=0&jgpx=0&1=1&meiye='.$pageSize.'&page='.$page;

$content = httpRequest($url);

//$content = mb_convert_encoding($content,'utf-8'); //此方方法打印后还是乱码

//$content = mb_convert_encoding($content,"utf-8", "GBK"); //此方方法打印后还是乱码

//$content = mb_convert_encoding($content,'UTF-8','UTF-8,GBK,GB2312,BIG5'); // 此方方法打印后还是乱码

// 最后用此方法，解决了

$content = mb_convert_encoding($content ,'HTML-ENTITIES',"GBK");

$dom = new \DOMDocument();

$BDomain = new BDomain();

//从一个字符串加载HTML

@$dom->loadHTML($content);

$xpath = new \DOMXPath($dom);

php使用curl获取文本出现中文乱码的解决办法

在使用php的curl获取远程html文本时出现了中文乱码。

解决办法的代码如下：$url = "gongfuma.com";

//获取页面内容

$ch = curl_init();

curl_setopt ($ch, CURLOPT_URL, $url);

curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT,20);

$res = curl_exec($ch);

curl_close($ch);

$res=mb_convert_encoding($res, 'UTF-8', 'UTF-8,GBK,GB2312,BIG5');

//使用该函数对结果进行转码

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

息相吹

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

近期1年来PHP面试题整理

wang_ze的博客

05-31

5849

面试：冲击月薪18k(税后),你应该具备哪些技能?1.熟悉设计模式,单例,工厂,策略,观察者能根据实际场景写出代码2.熟悉框架tp,yii,larval,symfony,Phalcon7;至少读过其中之一的源码3.熟悉memcache,redis的使用,特别是redis,熟悉redis的主从配置;熟悉mongodb4.熟练掌握mysql,视图,触发器,sql语句优化,表设计,sql注入,锁,事物...

使用goquery实现对网页信息的爬取

qq_42215697的博客

09-08

1264

概述本文参考飞雪无痕的《golang goquery selector(选择器) 示例大全》飞雪无情的博客

参与评论您还未登录，请先登录后发表或查看评论

PHP解决URL中文GBK乱码问题的两种方法

01-20

一般情况下对URL进行UrlEncode 处理， urlencode()，urldecode()；也可以通过iconv(‘utf-8’, ‘gb2312’, $ret)对接收到的数据进行编码转换。您可能感兴趣的文章:PHP fopen 读取带中文URL地址的一点见解PHP中文URL编解码(urlencode()rawurlencode()php中解析带中文字符的url函数分享php中url传递中文字符,特殊危险字符的解决方法php下目前为目最全的CURL中文说明php url地址栏传中文乱码解决方法集合php处理带有中文URL的方法

domdocument php charset gbk,php domdocument中文乱码怎么办

weixin_42525601的博客

03-13

140

php domdocument中文乱码的解决办法：首先打开相应的文件；然后进行编码声明，语句为“$dom->loadHTML(mb_convert_encoding($profile, 'HTML-ENTITIES','UTF-8'))”。PHP DOMDocument loadHTML出现乱码的解决方法DOMDocument::loadHTML默认编码是ISO-8859-1，所以我们需要做...

PHP 正则表达式获取网页charset 编码，可以获取任意网页charset（代码备份）

____

09-21

7189

$wcharset = preg_match("/<meta.+?charset=[^\w]?([-\w]+)/i",$filecnt,$temp) ? strtolower($temp[1]):""; $wtitle = preg_match("/(.*)/isU",$fi

php domdocument中文乱码,php domdocument中文乱码怎么办

weixin_39697143的博客

03-20

256

php domdocument中文乱码怎么办php domdocument中文乱码的解决办法：首先打开相应的文件；然后进行编码声明，语句为“$dom->loadHTML(mb_convert_encoding($profile, 'HTML-ENTITIES','UTF-8'))”。推荐：《PHP视频教程》PHP DOMDocument loadHTML出现乱码的解决方法DOMDocumen...

php 抓取页面乱码

Royal

07-19

4543

在抓取页面的时候出现类似��这样乱码解决方法如下1、转换编码 str=mbconvertencoding(str = mb_convert_encoding(str, “utf-8”, “GBK”); 2、数据经过gzip压缩curl获取数据的时候设置添加下面的选项： curl_setopt($ch, CURLOPT_ENCODING, 'gzip');使用file_get_conte

html+css+js基础问答

qq_43751465的博客

08-26

5339

css3 1.标签语义化顾名思义，合理的标签干合适的事情块级（display：block）：div 、p、h1~h6、hr、ul、ol、li、dl、dd、form、table、header、footer、main、nav、sector、arcitcle、pre、table、tbody、thead、th、tr、tfoot 行级（display：inline）：a、span、small、strong、em、i、code、行内块（display：inline-block）：img、input 区别： 1.

web编程项目--新闻网站搭建

ningmengweiya的博客

04-30

2262

web编程项目–1)新闻爬取一共选了四个新闻网站进行爬虫，分别是人民网、新浪新闻、网易新闻、央视新闻，其中主要爬取的网站是人民网和新浪新闻（爬取多天数据、总数据量达903条）并且将爬取结果存储在mysql中。 1.爬虫原理首先我们搜索主页面，获取我们想要的子网页的URL 通过request请求，cheerio解析，each遍历搜索出我们子网页页面中我们需要的信息：标题，正文等通过request请求，cheerio解析将我们需要的信息保存下来，通过各种形式访问到这种信息建立fetc

十年架构师强烈推荐的面试通关宝典，你知道多少？

m0_62714732的博客

11-10

726

一数据库 1．常问数据库查询、修改（SQL查询包含筛选查询、聚合查询和链接查询和优化问题，手写SQL语句，例如四个球队比赛，用SQL显示所有比赛组合；举例2：选择重复项，然后去掉重复项；）数据库里的密码如何加密（md5）； (1)数据库的密码加密:单向加密,insert into users (username,password) values (‘mike’,MD5(‘guessme’)); (2)双向加密:insert into users (username ,password) value

PHP_DOM处理中文乱码问题,DOMDocument->loadHTML()处理中文的一点问题

weixin_34381666的博客

11-27

1642

2019独角兽企业重金招聘Python工程师标准>>> ...

php获取浏览器参数乱码,php抓取gbk编码页面中文乱码解决方法

weixin_34379040的博客

04-13

409

php抓取gbk编码 中文乱码 多种解决方法今天做项目，抓取了一个gbk编码的页面后发生中文乱码，最后找到解决方案是：使用：$content = mb_convert_encoding($content ,'HTML-ENTITIES',"GBK");转码后就好了。$url='http://www.juming.com/ykj?api_sou=1&tao='.$id.'&ym...

php gzip乱码,php file_get_contents抓取Gzip网页乱码的解决方法

weixin_29866423的博客

03-20

262

本节内容：file_get_contents抓取Gzip网页乱码在php编程中，使用 file_get_contents() 函数抓取网页会发生乱码。导致乱码的可能原因如下：一个是编码问题，一个是目标页面开了Gzip。以下为大家介绍下在开启Gzip功能时，防止产生乱码的方法。把抓取到的内容转下编码即可($content=iconv("GBK", "UTF-8//IGNORE", $content)...

php抓取页面内容乱码,如何解决抓取乱码php网页的问题

weixin_42492233的博客

03-13

389

爬行乱码php网页的解决方案:1。使用“mbconvertencoding”来转换编码；2.设置并添加“curl _ setopt ($ ch，curl opt _ encoding，& # 39；gzip & # 39)；”选项；3.在顶部添加标题代码。推荐:“PHP视频教程”Php抓取乱码页面抓取页面时，像这样乱码字符的解决方案如下1.转换编码str=mbconvertenco...

simple_html_dom乱码,node爬虫解决网页编码为gb2312结果为乱码的方法

weixin_29699727的博客

06-21

243

最近需要对某消防网站进行宣传力度区域进行统计，使用一般采用的http模块进行数据抓取的时候发现结果是乱码，翻看原网站才发现，该消防网站是gb2312的编码，而http模块爬出的数据不能进行gbk解析，因此本片文章主要为解决用node对网站编码为gb2312爬虫时得到乱码这一问题。1. 使用工具：webstorm，node开发神器，强烈推荐2. 再说思路：先对新闻列表页面进行爬虫，再对抓到的链接一一...

php DOM 乱码解决

wml

09-12

1031

/** * 请求url页面信息 * @param str $url * @return str mixed|boolean */ function curl_get($url) { $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $url); curl_setopt($curl, CURLOPT_RETURN

php xml转gbk编码格式,PHP的XML字符编码问题

weixin_42303803的博客

03-28

297

我有创建XML的代码,我唯一的问题是使用á,olá和ção等单词的编码.这些字符没有正确显示,当我尝试读取XML时,我得到一个与该字符相关的错误.$dom_doc = new DOMDocument("1.0", "utf-8");$dom_doc->preserveWhiteSpace = false;$dom_doc->formatOutput = true;$element = ...

content type:text/html charset gbk,中文乱码问题

weixin_29602351的博客

06-18

1634

中文乱码这个问题，在我们的开发过程中是个经常遇到的问题，而这一问题的答案和解决方案也遍布互联网的各个角落。随便搜一下中文乱码，可以找到符合条件的记录成千上万。然而由于使用框架的不同，各人的开发环境的不同，中文乱码的情况及原因也各不相同。情况：有可能是在数据库里显示中文而页面进行提交时就成了乱码，有可能页面能正常显示中文而数据库里却不能正常显示中文。总之情况有很多种，数据库里不能正常显示中文有可能就...

PHP使用DOMDocument生成HTML：含表单、表格与CSS

"这篇教程详细介绍了如何使用PHP的DOMDocument类来生成HTML实例，包括常见的HTML标签元素，如表单、表格以及CSS样式。通过示例代码，读者将学习到如何创建新的DOM文件，添加HTML元素，以及为元素设置属性。" 在PHP...