php提取html中 body 内容,【PHP】用正则去获取html中的正文body内容，为什么取出来为空?【已解决】...

最新推荐文章于 2021-07-07 21:41:19 发布

陈泽杜

最新推荐文章于 2021-07-07 21:41:19 发布

阅读量647

点赞数

文章标签： php提取html中 body 内容

问题如题，先上html文件，需要取里面的body内容，直接上代码：

你好你好

接着是php代码：

/**

* 在html文件中找出正文

* Created by PhpStorm.

* User: Administrator

* Date: 2016/11/15

* Time: 21:43

$filename = '8/index.html';

$res = get_body_from_html($filename);

var_dump($res);

/**

* 在html文件中找出正文

* @param $filename string 路径url

* @return array|bool

function get_body_from_html($filename)

{

if (!file_exists($filename)) {

return false;

}

$file = file_get_contents($filename);

$res = array();

preg_match('/

(.*)/', $file, $res);

return $res;

}

运行之后发现：

array(0) { }

如果里面的方法改为：

function get_body_from_html($filename)

{

if (!file_exists($filename)) {

return false;

}

// $file = file_get_contents($filename);

$file = '

你好>

我不好我不好

$res = array();

preg_match('/

(.*)/', $file, $res);

return $res;

}

运行之后就可以正确输出：

array(2) {

[0]=>

string(42) "

我不好我不好

[1]=>

string(29) "

我不好我不好

}

所以要请教一下为何写的正则抓不到内容呢？

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

陈泽杜

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

php 获取一个文件body标签里的内容

ORa的博客

03-15

1624

php 获取一个文件和之间的内容用法：先添加函数function catbody (filename)。再用catbody(filename) 。再用catbody (filename)。再用catbody(filename); //$filename 调用就行了，就是文件名称。 function catbody ($filename) { //找到<body> ,之后字符...

jsoup 获取html中body内容_jsoup实现java抓取网页内容

weixin_39614521的博客

12-22

815

jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。jsoup的主要功能如下：1. 从一个URL，文件或字符串中解析HTML；2. 使用DOM或CSS选择器来查找、取出数据；3. 可操作HTML元素、属性、文本；jsoup是基于MIT协议发布的，可放心使用于商业...

参与评论您还未登录，请先登录后发表或查看评论

php获取body内容

03-15

php获取body内容.function catbody ($filename) { //找到<body> ,之后字符有效。 $content = file_get_contents("$filename"); $i = strpos("$content","<body"); $j = $i +1 ; $k = strpos("$content",">",$j); //找到</body>，之前字符有效。 $m = strpos("$content","</body",$j); //理想情况就是这样子的。 //输出 echo "<hr />文件名：$filename <br />"; for(++$k;$k<$m;$k++) { echo "$content[$k]"; } }//end func catbody(). --------------------- 作者：O_Ra 来源：CSDN 原文：https://blog.csdn.net/qq_40534785/article/details/88580441 版权声明：本文为博主原创文章，转载请附上博文链接！

php 正则截取页面内容,php正则提取页面body和body之间的内容

weixin_29149709的博客

03-09

713

公告：为响应国家净网行动，部分内容已经删除，感谢读者理解。话题：php正则提取页面body和body之间的内容回答：/lt;body.*?gt;(.*?)lt;\/bodygt;/is .*？最小匹配，如果去掉？号，则默认是婪匹配而前面加了？：则表示.*？所匹配的结果不会保存在缓内话题：如何使用selenium webdriver 获取body中的内容回答：selenium webdriver...

php提取html中 body 内容,php,正则表达式_【PHP】用正则去获取html中的正文body内容，为什么取出来为空?【已解决】，php,正则表达式,html - phpStudy...

weixin_39796878的博客

03-10

294

【PHP】用正则去获取html中的正文body内容，为什么取出来为空?【已解决】问题如题，先上html文件，需要取里面的body内容，直接上代码：你好你好接着是php代码：/*** 在html文件中找出正文* Created by PhpStorm.* User: Administrator* Date: 2016/11/15* Time: 21:43*/$filename = '8/index....

php response body,数据库读写没问题，response body部分空

weixin_31128065的博客

03-19

267

求助~!文章操作这部分，_handleArticleList()，使用 return时，response 的 body 部分为空，用print_r()能显示，代码照着视频中的敲的。User部分的注册就没问题，得到的response 的 body中有注册用户信息。谢谢！getList```phppublic function getList($user_id,$page=1,$size=10){if...

go语言提取html,Go语言使用正则表达式提取网页文本

weixin_39525307的博客

05-31

775

Go语言使用正则表达式提取网页文本,例子,代码,正则表达式,语言,字符串Go语言使用正则表达式提取网页文本易采站长站，站长之家为您整理了Go语言使用正则表达式提取网页文本的相关内容。示例：在字符串 1000abcd123 中找出前后两个数字。例子1：匹配到这个字符串的例子package main import( "fmt" "regexp") var digitsRegexp = ...

php获取网页标题和内容函数(不包含html标签)

12-19

这里，函数使用正则表达式从`CURLINFO_CONTENT_TYPE`中提取字符集，以便正确解码内容。最后，为了提取网页标题、描述和关键词，通常需要解析HTML。尽管在提供的代码中没有展示这部分，但通常会使用PHP的DOM解析库...

PHP正则获取HTML里需要的数据

夏已微凉、

12-29

1249

PHP正则获取HTML里需要的数据 1、使用的函数： preg_match()匹配单个 preg_match_all()匹配所有 2、代码： /** * @todo 正则获取HTML中想要的数据 */ public function rege...

php获取html所有内容,php获取html网页内容的多个方法

weixin_30140317的博客

03-18

1089

例1，用file_get_contents 以get方式获取内容。$url='http://www.01xj.net/';$html = file_get_contents($url);//print_r($http_response_header);ec($html);printhr();printarr($http_response_header);printhr();?>例2，用fop...

PHP获取HTML网页内容的多种方法（精）

热门推荐

xhhayward的博客

09-14

1万+

方法1: 用file_get_contents 以get方式获取内容方法2：用file_get_contents函数,以post方式获取url 方法3: 用fopen打开url, 以get方式获取内容方法4: 用fopen打开url, 以post方式获取内容方法5：用fsockopen函数打开url，以get方式获取完整的数据，包括header和body 方法6：用fsockopen函数打开url，以POST方式获取完整的数据，包括header和body 方法7:使用curl库，使用cur

php只抓取网页body文字内容，并过滤网页标签

积善之家

07-07

514

php只抓取网页文字内容，并过滤其标签，说干就干，开始！ <?php function curl_request ( $url , $post = '' , $cookie = '' , $returnCookie = 0 ) { $ua = $ua==''?$_SERVER ['HTTP_USER_AGENT']:'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C...

php实现将上传word文件转为html的方法

luyaran的博客

12-30

2950

本文实例讲述了php实现将上传word文件转为html的方法。分享给大家供大家参考。具体实现方法如下：上传页面： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> html xmlns="http:

php获取html内的纯文本

hyb1234hi的专栏

11-06

4097

function getplaintextintrofromhtml($html, $numchars) { // Remove the HTML tags $html = strip_tags($html); // Convert HTML entities to single characters $html = html_e...

python读取html中body_小猿圈Python入门之批量获取html内body内容的方法

weixin_39912566的博客

12-06

445

对于人工智能你了解有多少？你知道Python的使用吗？这个对于大部分初学者来说都是很难的，小猿圈Python讲师会每天为大家选择分享一个知识点，希望对你学习Python有所帮助，今天分享的就是批量获取html内body内容的方法。现在有一批完整的关于介绍城市美食、景点等的html页面，需要将里面body的内容提取出来。方法：利用python插件beautifulSoup获取htmlbody标签的内...

JVM参数

啦卡的博客

10-27

199

1、JVM参数分为3中类型：标准参数、-X参数、-XX参数（使用率高）（1）标准参数：比较稳定，一般在未来的JVM中不改变 -help -version 如在cmd界面中，输入：java -version HotSpot表示JVM的类型 64-Bit表明是64位JVM Server表示运行在服务器模式 mix...

js正则提取body标签中有标签内容