public function getAData()
{
$url = '要获取的url';
$cookie = 'PHPSESSID='.$cp_cookie; //模拟登录
$str = $this->sendRequest($url,$cookie); // 携带cookie发送curl请求,该方法就是个curl,网上可以随便找个
//正则查找带href的a标签,代表要找的class名称
$patt1 = '/<a href=\"(.*?)\" class=\"label label-success\".*?>(.*?)<\/a>/i';
//根据正则匹配
preg_match_all($patt1,$str,$first_match);
//获取a标签中的内容
$patt2 = "/>(.*)<\/a>/";
//获取href中的值
$patt3 = "/href=\"([^\"]+)/";
//空数组,用于存储遍历的数据
$arr = array();
//遍历二维数组
for ($i=0;$i<count($first_match[0]);$i++) {
//根据正则匹配,获取a标签中的内容
preg_match_all($patt2,$first_match[0][$i],$acontent);
//根据正则匹配,获取href中的值
preg_match_all($patt3,$first_match[0][$i],$ahref);
$arr[$i]['content'] = $acontent[1][0];
$arr[$i]['url'] = $ahref[1][0];
}
$data = array();
foreach ($arr as $key=>$value) {
$data[] = $value;
}
return json($data);
}
thinkphp筛选html标签内容以<a>标签为例携带cookie
于 2022-04-28 10:48:03 首次发布