现在 中文分词现在都是用 scws 或者 sphinx 这种来分词了
而我只是想分个文章或者小标题 想找个简单的分词就一直找不到; 无奈之下找到一个不出名的类库 自己稍加修改 就做好了分词;
现在进入正文;
下载完成后放在自己的类库中备用;注意要从lib目录中拿出来
现在来到控制器加载个方法
/**
* 关键字提取方法
*
* @param $title string
* 进行分词的标题
* @param $content string
* 进行分词的内容
* @return array 得到的关键词数组
*/
public static function getKeywords($title = "", $content = "") {
if (empty ( $title )) {
return array ();
}
if (empty ( $content )) {
return array ();
}
$data = $title . $title . $title . $title; // 为了增加title的权重,这里连接4次
$pa=new \biz\count\phpanalysis(); //实例化
$pa->LoadDict ();
$pa->SetSource ( $data );
$pa->StartAnalysis ( true );
$tags = $pa->GetFinallyKeywords ( 2 ); // 获取文章中的3个关键字,想要几个就写几个就行
return $tagsArr;//返回关键字数组
}
就直接调用此方法就行了;
$FLabelRe=$this->getKeywords($title,$content); //直接调用方法 就返回数组了
看下效果
$title="金融危机重创东南亚,泰国、马来西亚、菲律宾、印度尼西亚等国损失惨重";
备注:要是没有调用到词典是会报错或者分词不准哦;要把路径填清楚;实例化成功后进LoadDict方法去var_dump一下字典就可以知道有没有应用成功了 只要路径都是正确的就可以用了