php提取html中指定div下a标签的text和href问题
已解决,有点凌乱,速度就行。
header('content-type:application/json;charset=utf8');
$url='http://www.hkxy.edu.cn/';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_NOBODY, 0); // remove body
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36');
$response = curl_exec($ch); // 检查是否有错误发生
if(curl_errno($ch)) {
echo 'Curl error: ' . curl_error($ch);
} else{
echo htmlspecialchars($response);
}
curl_close($ch);
$response=iconv('gbk', 'utf-8', $response);
$response=str_replace(' ','',$response);
$pa = '%
preg_match_all($pa,$response,$arr);
$pa = '%(.*?)%sim';
preg_match_all($pa,$response,$arr);
$result=array();
$number=count($arr[1]);
for($i=0;$i
$temp=explode('/',$arr[1][$i]);
//print_r($temp);exit();
$result[$temp[2]][$i]['src']='http://www.hkxy.edu.cn'.$arr[1][$i];
$result[$temp[2]][$i]['title']=$arr[2][$i];
}
echo JSON($result);
function arrayRecursive(&$array, $function, $apply_to_keys_also = false)
{
static $recursive_counter = 0;
if (++$recursive_counter >1000 ) {
die('possible deep recursion attack');
}
foreach ($array as $key => $value) {
if (is_array($value)) {
arrayRecursive($array[$key], $function, $apply_to_keys_also);
} else {
$array[$key] = $function($value);
}
if ($apply_to_keys_also && is_string($key)) {
$new_key = $function($key);
if ($new_key != $key) {
$array[$new_key] = $array[$key];
unset($array[$key]);
}
}
}
$recursive_counter--;
}
/**************************************************************
*
* 将数组转换为JSON字符串(兼容中文)
* @param array $array 要转换的数组
* @return string 转换得到的json字符串
* @access public
*
*************************************************************/
function JSON($array)
{
arrayRecursive($array, 'urlencode', true);
$json = json_encode($array);
return urldecode($json);
}
URL:http://www.hkxy.edu.cn/
如图所示:
我想提取.offer_box_wide1下a元素的text和href怎么破?求教
相关阅读:
想要一个移动端的开发demo
hexo在deploy到github总是报错,求助
MYBATIS外键对应表的字段查询本表
ExtJS中gridPanel中的actionColumn怎么做成动态?
Spring 重定向无法实现页面跳转
angularjs ui-router 的过渡动画
grep的匹配问题
Java:jps访问远程JVM,除了1099端口外还需要开放哪些端口
iOS 刚下载的SDK 放入新工程则报错 需要添加那些依赖库和注意其他那些方面
PHPmailer 使用网易126发送邮件的问题
Firebase是个什么东西,如何定位。
部署JavaWeb项目,war包和将war包解压部署有何区别?
redis+mysql基本应用
ios打包问题
ssh输入密码登陆linux和免密码登陆linux中间进行了怎样的过程?
通过js动态插入的图片如何通过构建工具将其转为base64编码
cmd中flask/Scripts/python run.py出错?
如何在Mac上卸载composer?
html5+ 的api怎么用
封装的一个物体移动的对象,怎么实现多物体同时移动??