php 中文分词类库 简易版

1 篇文章 0 订阅
1 篇文章 0 订阅

现在 中文分词现在都是用 scws 或者 sphinx 这种来分词了
而我只是想分个文章或者小标题 想找个简单的分词就一直找不到; 无奈之下找到一个不出名的类库 自己稍加修改 就做好了分词;

现在进入正文;

git下载类库包

下载完成后放在自己的类库中备用;注意要从lib目录中拿出来

现在来到控制器加载个方法

 /**
     * 关键字提取方法
     *
     * @param $title string
     *         进行分词的标题
     * @param $content string
     *         进行分词的内容
     * @return array 得到的关键词数组
     */
    public static function getKeywords($title = "", $content = "") {
        if (empty ( $title )) {
            return array ();
        }
        if (empty ( $content )) {
            return array ();
        }
        $data = $title . $title . $title . $title; // 为了增加title的权重,这里连接4次


        $pa=new \biz\count\phpanalysis();  //实例化 


        $pa->LoadDict ();

        $pa->SetSource ( $data );

        $pa->StartAnalysis ( true );

        $tags = $pa->GetFinallyKeywords ( 2 ); // 获取文章中的3个关键字,想要几个就写几个就行


        return $tagsArr;//返回关键字数组
    }

就直接调用此方法就行了;

  $FLabelRe=$this->getKeywords($title,$content); //直接调用方法 就返回数组了

看下效果

$title="金融危机重创东南亚,泰国、马来西亚、菲律宾、印度尼西亚等国损失惨重";

这里写图片描述

备注:要是没有调用到词典是会报错或者分词不准哦;要把路径填清楚;实例化成功后进LoadDict方法去var_dump一下字典就可以知道有没有应用成功了 只要路径都是正确的就可以用了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值