php cms 自动分词,灵活运用PHPAnalysis分词组件,实现Phpcms v9关键词自动分词

在2019年12月下旬,Phpcms官网phpcms.cn关闭后,原有的分词api接口(http://tool.phpcms.cn/api/get_keywords.php)已经失效,在录入标题后再也不能自动提取关键词到关键词的输入栏了,针对这一问题,CMSYOU在之前的分词经验基础上,做了几个分词系统的分析,最后完善整理出来Phpcms v9关键词自动分词组件,今天在这里与大家分享中文分词的那些事。

一、没有了原来的自动分词获取关键词后怎么办?

Phpcms原有的分词api接口失效后报错

解决方式1:忽视它、或者注释掉,手动录入关键词,这样更精准。

具体方法:修改api/get_keywords.php,把echo get_keywords($data, $number);改成//echo get_keywords($data, $number); 也就是注释掉这一行,不执行操作,这样避免引发报错。

解决方式2:改造它、省事的功能不能停!

如果你之前一直用,一下子没有了,是不是很不习惯?那么自己就动手改造、实现恢复这个自动分词功能!

二、实现Phpcms v9关键词自动分词的方法

解决方式1:如果你对Php程序或者Phpcms不熟悉,可以选择Phpcms v9关键词自动分词组件,省事的办法,也省时。

Phpcms v9关键词自动分词组件截图

解决方式2:自己动手改造。

当前市面上,常见的分词工具组件有ICTCLAS、HTTPCWS、SCWS、PhpanAlysis、MMSEG4J、IKAnalyzer、盘古分词这些,其中号称最强大的ICTCLAS汉语分词系统不开源,SCWS开源免费但需要对PHP环境安装php_scws.dll拓展、限制了一部分用户。此外,CMSYOU觉得PhpanAlysis不错,比较轻量,准确度也比较好,大家可以深入研究。如果服务器支持,可以考虑开源的SCWS中文分词,以下是SCWS的介绍:

SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统)。

这是一套基于词频词典的机械式中文分词引擎,它能将一整

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值