php关键词加链接,文章中关键词加链接的思路和php的实现

一般在文章展示的时候,都会将其中的关键词加上链接,增加网站的粘合性。咋一想挺简单的,直接替换字符串不就行了。可细细想来,还是有不少问题。比如文章内的html标签,标签里的内容可以不用替换;再比如一个关键词包含另外一个关键词,如果先替换短的关键词,那就会有问题。

针对这些问题,笔者做了一些处理,封装成了一个类,可以点击下面的链接直接下载代码:

1、简要说明下实现的思路:

对关键词数组进行排序,长的关键词排到前面,这样就可以先替换长的关键词。

提取出所有html标签,暂存到数组里。

根据html标签对内容进行分割,将分割的内容保存到一个数组里。

循环分割的内容数组,替换关键词链接。

将提取的html标签和分割的内容数组拼接起来,得到最终结果。

2、关键步骤的代码说明:

关键词数组排序

关键词数组$keywordArray是二维数组,结构如下:

$keywordArray = array(

array('进程', 'http://www.01happy.com/linux-ps-view-process/')

,array('守护进程', 'http://www.01happy.com/linux-python-daemon/')

);

二维数组排序可以使用内置函数usort,代码如下:

usort($keywordArray, function($a, $b) {

$al = strlen($a[0]);

$bl = strlen($b[0]);

if ($al == $bl)

return 0;

return ($al > $bl) ? -1 : 1;

});

提取出所有html标签

preg_match_all('/]*>/', $content, $match);

if (isset($match[0])) {

$htmlTagArray = $match[0];

}

这边的正则就是将<>包着的内容都提取出来,笔者认为凡是需要将<>号当成内容显示的,都应当用转义字符<&gt来替换,对于一切<>包着的内容都可以认为是标签。事实上浏览器也是这么干的,很多在线的文本编辑器也会自动转义这些字符。

分割内容,保存到数组

$noTagContentArray = preg_split('/]*>/', $content);

这边用的正则表达式和上面提取html标签用的正则一致。

循环分割的内容数组,替换关键词链接

这边的处理方式是先将关键词替换成md5值,再将md5值替换成带链接的关键词,之所以这么处理,是为了解决关键词之间包含的情况。另外,笔者曾经考虑将分割的内容数组implode成一个字符串,就不用循环替换了,但是担心implode之后的字符串在拼接处会形成关键词,所以就没这么处理。

组合提取的html标签和处理后的内容

这步就比较简单了,依次拼接就OK了。需要注意的是html标签数组会比分割的内容数组长度小1,所以在取标签时,要用isset来判断下。

以上程序笔者经过多次测试,暂时没发现什么问题,分享给大家,如果有发现什么问题,可以联系我,非常感谢,我的联系邮箱参考网站右边栏目。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值