分析一个字符串生成相关查询条件,比如搜索相关文章的功能

//分析一个字符串生成相关查询条件
//$column字段名,$title搜索的字符串function get_similar($column,$title){
	//去除搜索字符串中的空格
	$title=str_replace(" ",'',$title);
	//长度多少?
    $len=getStringLength($title);
	//长度小于2就直接返回xx like '%xx%'
	if($len<=2){return "{$column} like '%{$title}%'";}
	//大于二,就先建立一个数组,元素是xx like '%xx%'
    $like=array();
	//进行(字符串长度减一)次循环
    for($i=0;$i<$len-1;$i++)
	{
	  //每次取i和i+1这两个字符并拼接成xx like '%xx%'放入数组
      $like[]="{$column} like '%".utf8Substr($title,$i,2)."%'";
    }
	//用or把数组元素拼接成一个SQL的 xx like '%xx%' or xx like '%xx%' 形式的字符串
    $likes=implode(' or ',$like);
	//返回以供在SQL中使用
	return $likes;
}

比如数据库一个表有一个标题字段title

用户搜索词是:数据库

那么最后生成的字符串就是

title like ‘%数据%’ or title like ‘%据库%’

至于长度为什么是2呢?这是经过大量的实践经验的得到的,能搜索相似度比较高的。

如果是1个字符搜索的结果基本是不相干的,太长了匹配度也低而且搜索结果少。

用到的两个相关函数

//取得utf8字符串的长度,包括中英文。
function getStringLength($text){
   if (function_exists('mb_substr')) {
     $length=mb_strlen($text,'UTF-8');
   } elseif (function_exists('iconv_substr')) {
     $length=iconv_strlen($text,'UTF-8');
   } else {
     preg_match_all("/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf]
         [\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf]
         [\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/", $text, $ar);
     $length=count($ar[0]);

   }
   return $length;
}
//截取utf8字符串
function utf8Substr($str, $from, $len)
{
    return preg_replace('#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$from.'}'.
                       '((?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$len.'}).*#s',
                       '$1',$str);
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值