php 采集网站关键字,php远程获取网站的关键字信息(并附:php判断字符串编码)...

php远程获取网站的关键字信息(并附:php判断字符串编码)

很明显,php100是gbk编码的网站。现在获取它的关键字,并无乱码的显示出来,然后好保存到数据库。

84c34f97d1c9a9265267e1edfdb16f7d.png

function check_utf8($checkString){

if (preg_match("/^([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){1}/",$checkString) == true || preg_match("/([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){1}$/",$checkString) == true || preg_match("/([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){2,}/",$checkString) == true){

return true;

}

else{

return false;

}

}

$meta = get_meta_tags('http://www.php100.com');

echo '源数据:'.$keywords = $meta['keywords'];

echo '

 
 
'; 
 

if(check_utf8($keywords) == 0){

$keywords = iconv("GBK","UTF-8",$keywords);

}

$keywords = explode(',', $keywords );

$keywords = array_map( 'trim', $keywords );// 函数返回用户自定义函数作用后的数组【去除空格】

$keywords = array_filter( $keywords );//如果没有提供 callback 函数,array_filter() 将删除 input 中所有等值为 FALSE 的条目。

print_r( $keywords );

?>

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值