分享一个PHP中文分词,一定要看(13亿人看完都感动了^_^!!!)

<?php

/**
 * 中文分词处理方法
 *+---------------------------------
 * @param stirng  $string 要处理的字符串
 * @param boolers $sort=false 根据value进行倒序
 * @param Numbers $top=0 返回指定数量,默认返回全部
 *+---------------------------------
 * @return void
 */
function scws($text, $top = 5, $return_array = false, $sep = ',') {
    include('./pscws4/pscws4.php');//去下面给的网址把pscws4下载下来
    $cws = new pscws4('utf-8');
    $cws -> set_charset('utf-8');
    $cws -> set_dict('./pscws4/etc/dict.utf8.xdb');
    $cws -> set_rule('./pscws4/etc/rules.utf8.ini');
    //$cws->set_multi(3);
    $cws -> set_ignore(true);
    //$cws->set_debug(true);
    //$cws->set_duality(true);
    $cws -> send_text($text);
    $ret = $cws -> get_tops($top, 'r,v,p');
    $result = null;
    foreach ($ret as $value) {
        if (false === $return_array) {
            $result .= $sep . $value['word'];
        } else {
            $result[] = $value['word'];
        }
    }
    return false === $return_array ? substr($result, 1) : $result;
}
print_r(scws('青花夔龙纹香炉'));


scws网址:http://www.xunsearch.com/scws/

pscws4下载:http://download.csdn.net/detail/pzp_118/5412639

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值